网站开发设计教程,免费空间官网,怎样在网上卖产品,黄页114企业号码查询一句话引入#xff1a; 如果我们要做图像识别#xff0c;用的是一个200x200的图片#xff0c;那么BP神经网络的输入层就需要40000个神经元#xff0c;因为是全连接#xff0c;所以整个BP神经网络的参数量就是160亿个#xff0c;显然不能这样来训练网络#xff0c;所以我…一句话引入 如果我们要做图像识别用的是一个200x200的图片那么BP神经网络的输入层就需要40000个神经元因为是全连接所以整个BP神经网络的参数量就是160亿个显然不能这样来训练网络所以我们就需要在输入层之前加入一个处理图片的操作而这个操作的目的 1.为了把图片的特征提取出来减去没有必要的噪音。 2.降低矩阵的参数数量。 然后再输入到BP神经网络中去训练权重和偏置量。
1.感受野
人的眼睛看见东西不是一个神经元就能做到的而是很多个神经元每个神经元只负责自己的那块局部信息而很多个神经元组合而成就成了我们可以看见的图像。
2.卷积运算
卷积运算是用来提取图片中的特征的一次卷积运算的过程就是使用一个卷积核对整个图像进行一次运算不同的卷积核可以提取出来不同的特征比如直线曲线。卷积运算如下图 这实际上就是两个矩阵相乘求和的结果。卷积核会根据步长 来顺着对图片矩阵进行一次卷积运算假如步长为1那么下一步就如下图 其中不同的卷积核可以提取出不同的图片特征可以理解为有些卷积核是用来提取猪耳朵有些来提取猪鼻子。 Padding 所谓的padding操作实际上就是在图片边缘上下左右补0目的就是为了可以获取图片的边缘特征。
3.卷积核和感受野
不同的卷积核就像不同的视觉神经细胞不同的卷积核提取图片中不同的特征而当这些特征组合在一起的时候就成了一幅图当然是特征图。
4.多通道卷积
因为图片是彩色的所以我们一般会对RGB三个通道都做卷积运算然后在合并这三个矩阵
4.池化
在进行完卷积运算后需要对特征矩阵进行池化操作池化就是把特征矩阵变小 比较常见的池化操作如下
5. CNN
一个完整的CNN如下 这也是LeNet网络的结构两个卷积和池化最后一个池化中的多个特征矩阵拉成一个一维的矩阵作为BP神经网络输入如下图。 其中隐含层使用ReLu输出层使用的是softMax这样输出值就是标签和概率。 参考深度学习及应用-赵卫亮神经网络与深度学习-牟奇