1、nn.Conv2d#
PyTorch 中用于实现 二维卷积层(2D Convolutional Layer)的类
重要参数
- in_channels
入力データのチャンネル数(例えば RGB 画像は 3、グレースケール画像は 1) - out_channels
出力のチャンネル数、つまり畳み込みカーネルの数を示します。
# あなたが RGB 画像(3 チャンネル)を持っていて、サイズが 32×32 の場合:
conv = nn.Conv2d(in_channels=3, out_channels=16, kernel_size=3, padding=1)
# あなたが得る出力の形状は:[batch_size, 16, 32, 32]
- kernal_size
畳み込みカーネルのサイズ、一般的には 3 ⇌ (3,3) または 5 ⇌ (5,5)、または (3,5) なども可能です。 - stride
畳み込みカーネルの移動ステップ、出力特徴マップのサイズを制御します。ex:2、(3,5) - padding
入力の境界にゼロを追加する数、出力特徴マップの空間サイズを制御します。 - bias
バイアス項を追加するかどうか、デフォルトは True です。
2、nn.MaxPool2d#
PyTorch 中用于实现 二维最大池化层(2D Max Pool Layer)的类
填充 padding 和 步幅 stride 和 nn.Conv2d
一样。
没有可学习的参数
ex:
nn.MaxPool2d(3)
・kernel_size=3:入力特徴マップ上で 3x3 のウィンドウをスライドさせることを示します。
默认:
・stride=kernel_size、つまりウィンドウが毎回 3 ピクセル(非重複プーリング)スライドします。nn.Conv2d
のデフォルトパラメータとは異なります。
・padding=0、エッジパディングは行いません。
3、LeNet#
早期成功の神経ネットワーク