> 文章列表 > 李宏毅2021春季机器学习课程视频笔记11-卷积伸进网络(CNN)

李宏毅2021春季机器学习课程视频笔记11-卷积伸进网络(CNN)

李宏毅2021春季机器学习课程视频笔记11-卷积伸进网络(CNN)

 卷积神经网络架构

图像识别

 将图片拉直放入神经网络中进行训练。

 

 网络通过对图像中的存在的特征进行分析,判断当前属于何种类别。

 

神经网络其实不需要对整个图片进行分析,只需要对一些特殊的信息进行分析就可以得知当前图片所属的类别,基于此就可以对模型进行优化。

 

 不同的感知视野之间是可以重叠的,同一个receptive field可以有多个神经网络。

 卷积神经网络在图像识别中一般会考虑全部的channel

 同样的patterns会出现在图像的不同区域中。在每个感受域是否都需要一个detector来对鸟嘴进行识别。

可以把通过让不同的receptive field共享相同的detector,利用参数共享机制减少模型的中的参数数目,参数是相同的,但是输入是不同的,因此输出也是不一样的。

 

 

 

 

 

 

 

小的卷积核会不会不能侦测到一些大的特征信息?

解答:不会,因为只要网络的深度足够大,随着卷积运算的进行,卷积核都可以对图像中的特征进行有效提取(无论是大特征或者是小特征)。

 

 

 

Pooling的使用在减少模型计算量的同时,也会使得原始数据一些细微的特征被忽视,从而不能被考虑到,近些年随着计算能力的提升,模型的Pooling层使用会越来越少。

 围棋问题中的下棋任务就可以划分为一个分类任务,其共有19*19个类别,可以采用全连接神经网络来进行解决,但是采用CNN的效果会更好,将棋盘视作为19*19的matrix,在Alpha Go中每个位置由48个chanel构成。

 Alpha Go中的池化层操作如何解释?实际并没有采用Pooling操作。 

 CNN不能辨识放缩或者旋转后的图片。