【Pytorch】神经网络的基本骨架
nn.module的基本使用
nn.module是所有神经网络的基本类,其他的所有神经网络都是继承该类,在此基础上进行修改。
上面的forward函数,首先进行卷积操作,然后进行一次非线性操作,然后进行卷积操作,非线性操作
module的简单使用
import torch
from torch import nnclass Tudui(nn.Module):# 初始化 父类def __init__(self):super().__init__()def forward(self,input):output = input + 1return outputtudui =Tudui()x = torch.tensor(1.0)
output = tudui.forward(x)print(output)
卷积操作
使用卷积核对输入的图像进行操作
stride=1 卷积核走一步
卷积之后的输出
二维卷积
import torch# 导入卷积函数
import torch.nn.functional as F# 输入二维矩阵 模拟一个图像
input = torch.tensor([[1,2,0,3,1],[0,1,2,3,1],[1,2,1,0,0],[5,2,3,1,1],[2,1,0,1,1]])# 卷积核
kernel = torch.tensor([[1,2,1],
[0,1,0],
[2,1,0]])# batchsize 1 一个channel 5 x 5的图像
input = torch.reshape(input,(1,1,5,5))
kernel = torch.reshape(kernel,(1,1,3,3))print(input.shape)
print(kernel.shape)# 进行卷积操作 步长为1
output = F.conv2d(input,kernel,stride = 1)
print(output)# 卷积步长为2
output = F.conv2d(input,kernel,stride = 2)
print(output)# 填充1
output = F.conv2d(input,kernel,stride = 1,padding = 1)
print(output)
神经网络卷积层
一个卷积核
两个卷积核
- in_channels:输入通道数 由输入图像通道数决定
- out_channels;输出通道数 由卷积核数量进行决定 也代表最终输出通道数
- kernel_size:卷积核大小 控制输出大小
- stride:步长,也控制输出大小
import torchvision
from torch.utils.data import DataLoader
from torch import nn
from torch.nn import Conv2d
from tensorboardX import SummaryWriter
import torch# 转换成tensor张量形式 下载测试数据集
dataset = torchvision.datasets.CIFAR10("../data",train = False,transform = torchvision.transforms.ToTensor(),download = True)# 每次取出64长图片
dataloader = DataLoader(dataset,batch_size = 64)class Tudui(nn.Module):def __init__(self):super(Tudui,self).__init__()# 6个卷积核 n x n# 比如图片是3 x 3的 使用6 个 3 x 3的卷积核进行卷积操作 得到6个输出 每一个卷积核不一样self.conv1 = Conv2d(in_channels = 3,out_channels=6,kernel_size=3,stride =1,padding=0)# 前向传播def forward(self,x):x = self.conv1(x)return xtudui = Tudui()
print(tudui)writer = SummaryWriter("../logs")step = 0for data in dataloader:imgs,targets = data # 拆分元组output = tudui.forward(imgs)# 打印原始大小 64 3 32 32print(imgs.shape)# 每次取出64张图片 每张图片原本是3个channel 经过卷积操作变成6个channel 每张图片都是30 x 30大小print(output.shape)writer.add_images("input",imgs,step)# 对output 进行一次reshape 然后进行显示 64 6 30 30 -》 ?3 30 30 将图片转换成三通道output = torch.reshape(output,(-1,3,30,30))writer.add_images("output",output,step)step = step + 1
最大池化的使用-池化层
每次取出卷积核范围内最大的那个数字
如果cell_model = true表示图像中的数字不足以覆盖卷积核 仍然取出最大值
Input: N C H W N 代表batchsize C代表通道数
import torch
from torch import nn
from torch.nn import MaxPool2dinput = torch.tensor([[1,2,0,3,1],[0,1,2,3,1],[1,2,1,0,0],[5,2,3,1,1],[2,1,0,1,1]],dtype=torch.float32)# 改变tensor的形状
input = torch.reshape(input,(-1,1,5,5))print(input.shape)class Tudui(nn.Module):def __init__(self):super(Tudui,self).__init__()# 定义池化操作 最大卷积操作self.maxpool1 = MaxPool2d(kernel_size = 3,ceil_mode = True)# 前向传播def forward(self,input):output = self.maxpool1(input)return outputtudui = Tudui()
# 前向传播
output = tudui.forward(input)
print(output)