在閱讀網路文章時,有看到說1X1的卷積層能夠升維、降維,不了解所以然,故來查找。:P
卷積核尺寸為1X1的卷積層能夠達到降低和增加輸出的維度,是因為它能夠改變輸入數據的通道數量(depth),而不改變其空間維度(height和width),原理如下。
1X1卷積在每個空間位置上進行逐點卷積(pointwise convolution),通過將不同通道的訊息進行線性組合,從而實現通道數的改變,而不影響特徵圖的空間維度。這種操作既能提取特徵,又能有效控制計算複雜度。
舉個以尺寸為1X1X3且核數量為2的卷積處理3X3且通道數為3的特徵圖的過程為例。
在每個空間位置上,1X1卷積會進行以下計算:
輸出通道1=w11⋅x1+w12⋅x2+w13⋅x3
輸出通道2=w21⋅x1+w22⋅x2+w23⋅x3
其中,x1、x2、x3是輸入特徵圖在某個空間位置上的3個通道的值,wij是1X1卷積核的權重。
可以參考卷積神經網路(Convolutional neural network, CNN): 1×1卷積計算在做什麼這篇文章,覺得最下面的圖解釋得很清楚。
以上~
繼續趕路,繼續留腳印(XD)。