【QA】Convolution 的數理涵義為何?
Convolution也就是卷積,是進行影像辨識深度學習不可或缺的角色,近年來也廣泛用於時間序列、文字探勘領域中;然而,若從計算公式來說,Convolution的計算邏輯為何?
回答列表
-
2021/11/24 下午 04:14王健安贊同數:0不贊同數:0留言數:0
Convolution是影像辨識中常用於特徵擷取的技巧, 主要會將圖片中某塊區域以「線性組合」方式計算出最具代表性的值, 以下圖為例, 將左邊的圖中左上角的區塊先擷取出來, 可得知它的像素由左到右、由上到下分別是:255, 255, 255, ..., 0, 0, 0; 而用來擷取特徵的參數也會是一個 3*3 的結構, 由左到右、由上到下分別是:0, 0, 0, 1, 1, 1, 0, 0, 0; 將每個像數乘以某個參數並總和後, 就會得到最具代表性的值。 ![image](http://kwassistfile.cupoy.com/0000017D51023F5D000000206375706F795F72656C65617365414E53/1635308523880/large) 透過將「某個區域」的線性組合, 得出對特定區域而言格外有價值的資訊, 而這樣的概念其實也能用到其他領域, 其中自然語言處理就是典型的案例, 當文本被切割成許多字詞,並給與特定的Embedding後, 就很像一張圖片了吧!!(如下圖) ![image](http://kwassistfile.cupoy.com/0000017D51023F5D000000206375706F795F72656C65617365414E53/1635308523881/large) 而我們就可以用CNN的想法, 將特定字詞藉由線性組合計算出格外有資訊的值或向量(如下圖), 不只比RNN還有有效能與運算上的優勢,也更符合人在閱讀時的習慣。 ![image](http://kwassistfile.cupoy.com/0000017D51023F5D000000206375706F795F72656C65617365414E53/1635308523882/large) 除此之外, 圖神經網路(GNN)中的Graph Convolution Network (GCN)更是典型案例, 透過每個點周圍鄰居的線性組合, 得出該點與鄰居之間代表性的值, 在GNN當中相當經典的應用。 ![image](http://kwassistfile.cupoy.com/0000017D51023F5D000000206375706F795F72656C65617365414E53/1635308523883/large) 參考資料 * [ ] https://iter01.com/480243.html * [ ] http://web.ntnu.edu.tw/~algo/Convolution.html * [ ] https://chih-sheng-huang821.medium.com/%E5%8D%B7%E7%A9%8D%E7%A5%9E%E7%B6%93%E7%B6%B2%E8%B7%AF-convolutional-neural-network-cnn-%E5%8D%B7%E7%A9%8D%E9%81%8B%E7%AE%97-%E6%B1%A0%E5%8C%96%E9%81%8B%E7%AE%97-856330c2b703 * [ ] https://ithelp.ithome.com.tw/articles/10202856 * [ ] https://medium.com/hallblazzar-%E9%96%8B%E7%99%BC%E8%80%85%E6%97%A5%E8%AA%8C/%E5%AD%B8%E7%BF%92%E6%89%8B%E8%A8%98-cnn-based-nlp-application-eb803b17cd13