logo
Loading...

請問經驗分布函數(ECDF)的用途為何? - Cupoy

想請問經驗分布函數(ECDF)的用途為何?是用來判斷異常值嗎?如果是的話 又如何判斷呢?希望可以用白...

ml100-2,ecdf,ml100-2-d06

請問經驗分布函數(ECDF)的用途為何?

2019/05/02 下午 02:32
機器學習共學討論版
Ella Yang
觀看數:451
回答數:3
收藏數:1
ml100-2
ecdf
ml100-2-d06

想請問經驗分布函數(ECDF)的用途為何?

是用來判斷異常值嗎?如果是的話 又如何判斷呢?

希望可以用白話一點的方式解釋 謝謝

回答列表

  • 2019/05/02 下午 02:34
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:4

    想請問經驗分布函數(ECDF)的用途為何?


    => 嗨,這邊可以先比較兩種圖:


    • 機率密度函數(Probability Density Function, PDF)
    • 累積分佈函數(Cumulative Distribution Function CDF)


    簡單來說,PDF 是記錄每個值所佔的比例,CDF 就是把 PDF 累加起來的結果。因此 CDF 更可以看出數值間影響關係,例如增加幅度。CDF 是理論值,實際上根據資料畫出來的 CDF 稱為 ECDF。



    Reference:

    1. https://emredjan.github.io/blog/2017/07/19/plotting-distributions/

    2. https://stats.stackexchange.com/questions/239937/empirical-cdf-vs-cdf

  • 2019/05/02 下午 02:36
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:4

    是用來判斷異常值嗎?如果是的話 又如何判斷呢?


    => 當 ECDF 畫出來的圖會長這樣:

    表示資料很集中或是有異常值導致資料瞬間累積到極大值,後者表示有資料異常的可能性

  • 2019/05/03 下午 04:11
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

    了解 那叫才有傳一個stackflow的網址 裡面提到不要用step function,我想請問甚麼又是step function呢?如果不考慮用不用這個function,示不適就能直接用scipy的ECDF套件?https://stackoverflow.com/questions/14006520/ecdf-in-python-without-step-function


    => 我猜 step function 應該是會有階梯樣子的上升,不是像 CDF 那樣的平滑曲線(不過這一段不確定,應該不是一個專有的名詞)。這題可以用 scipy 或是 statemodel 套件實作都可以:)