監督式、非監督式及強化式學習對於資料集劃分的差異
2021/12/07 下午 01:21
機器學習概論
Yaoga
觀看數:75
回答數:1
收藏數:0
想請問以這三種的定義來看, 若在執行實務劃分資料集的過程中, 這三種機器學習的方法都會有訓練集跟測試集之分嗎? 還是只有監督式學習才會劃分訓練集跟測試集? 感謝!
回答列表
-
2021/12/08 上午 10:56Tony White贊同數:0不贊同數:0留言數:2
Hi Yaoga您好,對於您的問題回覆如下給您參考: 先講結論: 監督式學習一般都會劃分測試集與訓練集。 非監督式學習以及強化式學習,一般不需特別劃分。 ====以下是稍微細節的說明。====== 以目的性來說,監督式學習因為需要"預測"未知資料的結果,所以我們會希望將資料分訓練與測試集,讓模型學習以後能有資料能確認模型訓練的狀況。當然,你也可以不劃分訓練集與測試集,但是在模型訓練完以後你還是要另外找資料來做模型能力的確認。所以一般來說因為要訓練模型的資料筆數一般都會有一定數量,且都是經過特徵轉換後的結果(資料預處理),所以直接拿既有資料做劃分會比較有效率確認模型的能力喔。 而非監督式學習,因為主要目的為"分類"或"分群",也不用輸入標籤資料(即監督式學習的解答),所以一般都會將所有資料一起做分類,就不用特別分訓練集與測試集喔。 至於強化式學習,由於主要是持續記錄代理人與"環境","行動","回饋值"以及"狀態"。以求能夠得到最高回饋值的結果。就好比說你今天玩瑪利歐兄弟,然後由電腦負責操控主角,然後持續用他的方式想辦法玩到破關一樣。所以通常都會持續在某種狀態下去做訓練的循環。一般來說也不用特別分測試集與訓練集喔。 以上說明,再請你參考嘍。