請問經驗分布函數(ECDF)的用途為何?
想請問經驗分布函數(ECDF)的用途為何?
是用來判斷異常值嗎?如果是的話 又如何判斷呢?
希望可以用白話一點的方式解釋 謝謝
回答列表
-
2019/05/02 下午 02:34張維元 (WeiYuan)贊同數:1不贊同數:0留言數:4
想請問經驗分布函數(ECDF)的用途為何?
=> 嗨,這邊可以先比較兩種圖:
- 機率密度函數(Probability Density Function, PDF)
- 累積分佈函數(Cumulative Distribution Function CDF)
簡單來說,PDF 是記錄每個值所佔的比例,CDF 就是把 PDF 累加起來的結果。因此 CDF 更可以看出數值間影響關係,例如增加幅度。CDF 是理論值,實際上根據資料畫出來的 CDF 稱為 ECDF。
Reference:
1. https://emredjan.github.io/blog/2017/07/19/plotting-distributions/
2. https://stats.stackexchange.com/questions/239937/empirical-cdf-vs-cdf
-
2019/05/02 下午 02:36張維元 (WeiYuan)贊同數:0不贊同數:0留言數:4
是用來判斷異常值嗎?如果是的話 又如何判斷呢?
=> 當 ECDF 畫出來的圖會長這樣:
表示資料很集中或是有異常值導致資料瞬間累積到極大值,後者表示有資料異常的可能性
-
2019/05/03 下午 04:11張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
了解 那叫才有傳一個stackflow的網址 裡面提到不要用step function,我想請問甚麼又是step function呢?如果不考慮用不用這個function,示不適就能直接用scipy的ECDF套件?https://stackoverflow.com/questions/14006520/ecdf-in-python-without-step-function
=> 我猜 step function 應該是會有階梯樣子的上升,不是像 CDF 那樣的平滑曲線(不過這一段不確定,應該不是一個專有的名詞)。這題可以用 scipy 或是 statemodel 套件實作都可以:)