logo
Loading...

【QA】為什麼要對數值作特徵正規化? - 【教材專區】學習AI有困難? 讓Cupoy助教來幫你! - Cupoy

目錄 什麼是特徵正規化 特徵正規化有哪些方法 若不做特徵正規化,將會對模型造成什麼影響 有哪些模型就算沒有特徵正規化,也不會對模型效能造成影響 Reference 什麼是特徵正規化 將不同範圍的...

目錄 什麼是特徵正規化 特徵正規化有哪些方法 若不做特徵正規化,將會對模型造成什麼影響 有哪些模型就算沒有特徵正規化,也不會對模型效能造成影響 Reference 什麼是特徵正規化 將不同範圍的特徵轉換成同一個範圍的特徵 例如:將數值轉換成 [0, 1] 的範圍內 特徵正規化有哪些方法 Standardization(Z-Score Normalization) 將資料統一轉換成平均數為 0、標準差為 1 的資料 $X_{Standardization}=\frac{X-\mu}{\sigma}$ Normalization(Min-Max Scaler) 將資料統計轉換成 [0, 1] 的資料 $X_{Normalization}=\frac{X-X_{min}}{X_{max}-X_{min}}$ 若不做特徵正規化,將會對模型造成什麼影響?做了正規化又有什麼好處? 先備知識:「電腦」沒有單位的概念,只知道數字大小 反面案例:假設有兩個特徵,一個特徵是年齡,另一個特徵是每月薪資。有某筆資料的年齡、每月薪資都是 100 元,請問以「人」角度跟以「電腦」角度思考面向有相同嗎? 透過正規化,不僅讓每個特徵的範圍具體被定義,每個特徵的單位也都被轉換一致。 有哪些模型就算沒有特徵正規化,也不會對模型造成影響 Tree-based Model Decision Tree Random Forest eXtreme Gradient Boosting (XGBoost) Light Gradient Boosting Machine (LightGBM) Reference TOWARD AI 2020. Machine Learning Standardization (Z-Score Normalization) with Mathematics. https://towardsai.net/p/machine-learning/machine-learning-standardization-z-score-normalization-with-mathematicsJaitley U. 2018. Wht Data Normalization is necessary for Machine Learning Models. https://medium.com/@urvashilluniya/why-data-normalization-is-necessary-for-machine-learning-models-681b65a05029