LeNet跟LeNet5详解

1 LeNet结构

主要是为了手写数字识别

具体结构讲解：从图中例子可得

1 先传入一个灰度图像尺寸为1x28x28，通道数为1，尺寸为28x28的灰度图像

2 第一层5x5卷积，经过公式输入图像尺寸-卷积核尺寸+2padding/步长+1，（其中，因为是正方形，所以长宽都一样，直接一个式子得出）因为没有padding，输出特征图20个通道，24x24的尺寸。

3 经过第二层Pooling层，计算方式同上，得到20x12x12

4 在经过第三层5x5卷积，输出50x8x8，

5 第四层Polling，得到50x4x4

6 扁平化然后reshape为500x1的神经元用于全连接（也可以把上述得到的进行扁平化再进行一次全连接，800 -500）

7 然后Relu激活函数

8 全连接输出 10x1，代表十个数字的置信度

9 使用softmax来计算输出的值的在0-9的概率

（上述，其实上述每一层卷积都要使用Relu激活函数），下面代码复现再具体看

2 代码复现

import torch
import torch.nn as nn

class LeNet(nn.Module):

    def __init__(self) -> None:
        super().__init__()
        
        self.features = nn.Sequential(
            nn.Conv2d(in_channels=1, out_channels=20, kernel_size=5, stride=1, padding=0),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=(2, 2), stride=2),
            nn.Conv2d(in_channels=20, out_channels=50, kernel_size=5, stride=1, padding=0),
            nn.ReLU(),
            # nn.MaxPool2d(kernel_size=(2, 2), stride=2),
            nn.AdaptiveMaxPool2d((4, 4))  # 这个是为了不止让限制为28x28的输入图像
        )

        self.classify = nn.Sequential(
            nn.Linear(50 * 4 * 4, 500),
            nn.ReLU(),
            nn.Linear(500, 10)
        )
    

    def forward(self, x):
        z = self.features(x)
        z = z.view(-1, 800)
        z = self.classify(z) 
        return z
    

if __name__ == '__main__':
    net = LeNet()
    img = torch.randn(2, 1, 28, 28)
    scores = net(img)
    print(scores)
    probs = torch.softmax(scores, dim=1)
    print(probs)