吴恩达《深度学习》第四门课（1）卷积神经网络

小编 2026-06-26 阅读:1855 评论:0

1.1计算机视觉（1）计算机视觉的应用包括图像分类、目标检测、图像分割、风格迁移等，下图展示了风...

1.1计算机视觉

（1）计算机视觉的应用包括图像分类、目标检测、图像分割、风格迁移等，下图展示了风格迁移案例：

（2）图像的特征量非常之大，比如一个3通道的1000*1000的照片，其特征为3*1000*1000达到300万，如果第一个隐藏层有1000个单元那么W[1]有20亿个参数，计算量不仅大，而且由于图像样本相对于特征实在是太少，导致很容易过拟合，所以需要其他的方式来连接，即卷积。

1.2边缘检测示例

（1）卷积运算是输入图像与过滤器（也叫核）进行的运算，得到输出图像。卷积核与图像对应的位置相乘求和得到一个新值，如下图所示：

吴恩达《深度学习》第四门课（1）卷积神经网络

输出中第一个绿色框的值为：

吴恩达《深度学习》第四门课（1）卷积神经网络

（2）每个不同的核可以检测到不同的边缘特性，如下面的核就可以检测到图像的垂直特性，即输入图像中的边缘会在输出图像中用白色显示出来，非边缘部分显示为黑色或灰色。同理还有其他水平边缘检测等各种核（过滤器）。

吴恩达《深度学习》第四门课（1）卷积神经网络

1.3更多边缘检测的内容

（1）除了上面提到的卷积核，还有其他许多卷积核，把上面3*3的卷积核看成9个参数，然后不是通过人工的确定，而是通过神经网络来学习这些参数，这就是卷积神经网络。

1.4Padding

（1）边缘不填充会有两个缺点：第一是随着不断卷积，图像会变得越来越小，有时你可不想让它变小；第二是最角落的点只被使用了一次，这意味着在下传的过程中丢掉了图像边缘位置的信息。如下图所示（角落的绿色点只被计算了一次，中间红色点可以被计算多次）：

吴恩达《深度学习》第四门课（1）卷积神经网络

（2）Padding经常可以设置成为两个参数：第一个是Valid，即不做填充；第二个是Same，即输出尺寸与输入尺寸相等。

（3）在步长为1是有公式：n+2p-f+1为输出的尺寸。其中n是输入的尺寸（比如说宽），f是卷积核的大小（比如3），p是每一边额外添加的列数（如添加一列就为1）。所以根据这个式子很容易计算出用Same参数时，p=(f-1)/2，注意此处前提都是步长为1。

1.5卷积步长

（1）输入与输出的尺寸关系如下，注意当结果不是整数时是向下取整。

吴恩达《深度学习》第四门课（1）卷积神经网络

（2）在深度学习的卷积没有必要像数学或者信号处理教材中，先将卷积核顺时针旋转90°，然后在水平翻转，最后再进行与上面相同的卷积运算。深度学习直接忽略了那些旋转翻转的步骤。影响不大。

1.6三维卷积

（1）三维的卷积方法如下图所示，卷积核的通道数与输入图像的通道数相同，输出图像的通道数为所使用的卷积核的个数，至于高和宽还是按照上面提到的公式计算：

吴恩达《深度学习》第四门课（1）卷积神经网络

1.7单层卷积网络

（1）每一个卷积核的输出对应一个实数b（偏差），然后在进行激活函数的非线性转换得到输出，如下图所示：

吴恩达《深度学习》第四门课（1）卷积神经网络

（2）参数个数的计算：比如10个卷积核3*3*3，b的个数跟卷积核个数相同，所以总的参数为（3*3*3+1）*10=280，不管输入尺寸多大，参数个数始终保持不变，而在全连接网络中参数个数是会随着输入不同而不同的。

（3）一些符号如下所示，习惯上w用m*n_H^[l]*n_W^[l]*n_C^[l]表示，b用1*1*1*n_C^[l]。

吴恩达《深度学习》第四门课（1）卷积神经网络

1.8简答的卷积网络示例

（1）案例图如下：最核心的就是要会计算输出尺寸（公式（（n+2p-f）/s）+1，向下取整）。

吴恩达《深度学习》第四门课（1）卷积神经网络

1.9池化层

（1）池化层中没有需要学习的参数，所以通常不把池化层当做独立的一层来看。

（2）池化层是一般不会设置padding，即一般padding为0。

（3）fitter为2，stride为2是最常见的参数设置，尺寸图像缩小为原来的一半。

（4）卷积时用的尺寸计算公式同样适用于池化层，如下图所示：

吴恩达《深度学习》第四门课（1）卷积神经网络

（5）最大池化层比平均池化层更为常用。

1.10卷积神经网络示例

（1）下面是一个0-9数组分类的网络，包括了卷积层、池化层、全连接层：

吴恩达《深度学习》第四门课（1）卷积神经网络

（2）一般而言，不断卷积之后，图像的高度和宽度会变小，通道数（深度）会增加。

（3）在神经网络中，另一个常见的模式就是一个或多个卷积层之后跟随一个池化层，然后一个或多个卷积层之后跟随一个池化层，然后跟几个全连接层，最后是一个softmax.

（4）下面是针对上面网络的一些输出和参数的个数，其中参数一栏最后三行的值应该是48000+120、10080+84、840+10。

吴恩达《深度学习》第四门课（1）卷积神经网络

1.11为什么使用卷积

（1）卷积网络的参数远少于全连接的原因主要有两点：第一是参数共享，如左上角用一个垂直的卷积核检测，那么这个卷积核也同样适用于图像的其他区域；第二是稀疏连接，如某个输出值只与特定的几个值相连接（如九个值）。

（2）卷积神经网络善于捕捉偏移不变形，例如把图像往右平移几个像素，对于网络而言没什么影响。

版权声明

本文仅代表作者观点，不代表百度立场。
本文系作者授权百度百家发表，未经许可，不得转载。

上一篇：送气球.jpg（模拟） 下一篇：[Jupyter Notebook]EChart画图以及如何获取Python定义的变量

吴恩达《深度学习》第四门课（1）卷积神经网络

1.1计算机视觉

1.2边缘检测示例

1.3更多边缘检测的内容

1.4Padding

1.5卷积步长

1.6三维卷积

1.7单层卷积网络

1.8简答的卷积网络示例

1.9池化层

1.10卷积神经网络示例

1.11为什么使用卷积

版权声明

热门文章

机房智能化温湿度解决方式之POE供电以太网温湿度传感器

Sequential Monte Carlo Methods (SMC) 序列蒙特卡洛/粒子滤波/Bootstrap Filtering

HTTP状态保持的原理

Hive 系统函数及示例

CSRF的原理和防范措施

最近发表

标签列表

吴恩达《深度学习》第四门课（1）卷积神经网络

1.1计算机视觉

1.2边缘检测示例

1.3更多边缘检测的内容

1.4Padding

1.5卷积步长

1.6三维卷积

1.7单层卷积网络

1.8简答的卷积网络示例

1.9池化层

1.10卷积神经网络示例

1.11为什么使用卷积

版权声明

相关阅读

用户登陆注册【JDBC版】

jquery on和bind的区别

过滤器应用【编码、敏感词、压缩、转义过滤器】

JSP面试题都在这里

adb 详细使用文档（ADB命令使用大全）

JSP第六篇【自定义标签之传统标签】

热门文章

机房智能化温湿度解决方式之POE供电以太网温湿度传感器

Sequential Monte Carlo Methods (SMC) 序列蒙特卡洛/粒子滤波/Bootstrap Filtering

HTTP状态保持的原理

Hive 系统函数及示例

CSRF的原理和防范措施

最近发表

标签列表