Convolutional Layer:畳み込み層
用語集のトップページへ畳み込みとは
畳み込みとは、2つの情報源が組み合わさった系統的な手法で、ある関数を別のものに変える操作です。一般的に、畳み込みは画像をぼかしたり鮮明にしたりする効果を得るために画像処理で長らく使用されてきましたが、エッジやエンボスの高度化などその他の処理にも使用されてきました。CNNは隣接する層のニューロン間における局所結合パターンを強化します。
- 畳み込み
- 非線形(活性化関数ReLU)
- プーリングまたはサブサンプリング
- 分類(全結合層)
2次元畳み込み層
最も一般的に使用される畳み込みのタイプは2次元畳み込み層で、通常、conv2Dと略記されます。2次元畳み込み層のフィルタ(カーネル)は2次元の入力データを「スライド」して、要素ごとに乗算します。このため、計算結果は単一出力ピクセルにまとめられます。カーネルはスライドする領域全体に対し同じ演算を行い、特微量の2次元マトリックスを異なるタイプに変換します。膨張畳み込み/拡大畳み込み
この演算では、畳み込みカーネルにゼロ値を挿入することで、加重せずにウィンドウサイズを拡大します。膨張畳み込み/拡大畳み込みは、リアルタイムのアプリケーションや、RAM要件が少ないため処理能力が低いアプリケーションで使用可能です。分離可能な畳み込み
分離可能な畳み込みには主として、空間的に分離可能な畳み込みと、深さ方向に分離可能な畳み込みの2種類があります。空間的に分離可能な畳み込みは、基本的に画像およびカーネルの幅と高さについて空間の次元を処理します。空間的に分離可能な畳み込みと比べて、深さ方向に分離可能な畳み込みは2つの小さなカーネルに「因数分解」できないカーネルを処理します。そのため、分離可能な畳み込みはより頻繁に使用されます。転置畳み込み
このタイプの畳み込みは、デコンボリューションまたは逆畳み込みとも呼ばれます。転置畳み込み層は、通常の畳み込みを実行しますが、その空間変換を元に戻します。関連リソース
用語集のトップページへ