為何自變數(特徵)中若有非常態分布的情況下,去偏態會影響後續模型的好壞?
2021/01/21 下午 00:01
數值型特徵 - 去除偏態
SuYa
觀看數:262
回答數:4
收藏數:0
我想請問一下 在回歸分析的假設中,雖然有常態性的假設,但此實際上是對於應變數或目標(Y)的要求,為何自變數若有非常態的分布,去偏態能改善模型的表現? 在理論上不是很清楚,想問有人能解答嗎? 謝謝
回答列表
-
2021/01/21 下午 01:41李柏霆贊同數:1不贊同數:0留言數:2
ML中很多model都假設數據或參數服從正態分佈,簡單來說違反假設的東西想當然耳無法預期會有好的表現,所以要透過一個轉換來讓數據符合模型的假設
-
2021/01/21 下午 07:59Jeffrey贊同數:2不贊同數:0留言數:0
可以參考這一篇: https://medium.com/ai%E5%8F%8D%E6%96%97%E5%9F%8E/learning-model-%E5%9B%9E%E6%AD%B8%E5%88%86%E6%9E%90%E7%9A%84%E5%9F%BA%E6%9C%AC%E5%81%87%E8%A8%AD-37d9880f214d
-
2021/01/23 上午 01:09張維元 (WeiYuan)贊同數:4不贊同數:0留言數:0
嗨,你好
因為大部分的模型都是依據趨勢找關係,在常態的情況下趨勢是比較明顯的,關西也比較容易被模型所識別。
嗨,你好,我是維元,持續在不同的平台發表對 #資料科學、 #網頁開發 或 #軟體職涯 相關的文章。如果對於內文有疑問都歡迎與我們進一步的交流,都可以追蹤我的 Facebook 或 技術部落格 ,也會不定時的舉辦分享活動,一起來玩玩吧 ヽ(●´∀`●)ノ
-
2021/04/09 下午 09:00Rene Wang贊同數:0不贊同數:0留言數:0
對於使用梯度下降來達到最佳值的機械學習演算法,對自變數做標準化是很重要的一個工程,因為它會影響梯度下降法的效能。詳細的原因可以看這篇 [病態(ill-conditioning)二階導數矩陣](https://vocus.cc/girlsletscode/5e816bd2fd89780001a77351)