利用前幾筆的均值來當作特徵做回歸預測是否可行?
2021/04/11 下午 03:48
特徵類型
Yaoga
觀看數:37
回答數:3
收藏數:0
老師您好: 最近在使用機器學習建置一個檢驗數值預測的回歸模型 而此檢驗數值每固定一段時間會有一筆資料 特徵的來源可能就是設備的一些操作條件 如果想要提高回歸模型的準確度 可否利用目標檢測值的前幾筆均值作為新特徵呢? 我有嘗試這樣做過 但做完之後卻發現這個模型的特徵重要性 幾乎八九成都與這個均值有關 其他重要操作條件的重要性就會被淡化 這樣做的話 即使回歸預測效果很好的話 算是可行的嗎?
回答列表
-
2021/04/12 下午 02:37Jaio贊同數:0不贊同數:0留言數:0
若你在第五行指的「目標檢測值的前幾筆均值」確定為「用過去的數據算出來的」,那當然可行,因為在實際預測上,就是在想辦法找到過去重要的特徵,所以可行。 例如 : 想預測今天放學時間是否會被老師留下來挨罵,那訓練集的特徵為今天做過的事情,可以放「今天考試0分、昨天在路上踢到石頭、前天在家裡把碗盤打破」這三個,那很明顯的,「今天考試0分」當然是最重要的資訊(特徵),也就是你提到的均值,其實根本用不到其他兩個特徵。
-
2021/04/13 上午 09:58Yaoga贊同數:1不贊同數:0留言數:3
但若以工廠為例,如果將此預測模型轉為生成建議操作參數的話, 擔憂的是若均值的特徵影響性過大, 後續若要從其他重要的操作條件特徵吐出一組建議參數的話,會不會影響的變動性不甚明顯, 或者是要調到很大的範圍才對目標有所變化呢?(因含有均值這一個影響性大的特徵在)
-
2021/04/15 下午 09:14張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
嗨,你好
這就是特徵工程的一種手法,這樣是可行的。
嗨,你好,我是維元,持續在不同的平台發表對 #資料科學、 #網頁開發 或 #軟體職涯 相關的文章。如果對於內文有疑問都歡迎與我們進一步的交流,都可以追蹤 我的粉絲專頁 ヽ(●´∀`●)ノ