獨熱編碼 One-hot encoding 建立一個字典,再把詞下去做篩選,使它數值化, 但缺點是當詞量過多時會耗損太多的容量 整數編碼 Integer encoding 可以改善讀熱編碼耗損太多容量的問題,但仍無法找出詞彼此之間的關係 詞向量嵌入 Word embedding Word2Vec -CBOW:透過分析一個詞前後的詞,來判斷該詞的意思 -Skip-gram:透過一個詞來分析其前後的詞 Glove 做 WordVec 的延伸,透過向量空間了解詞之間的關係