吴恩达《深度学习》第一门课(3)浅层神经网络

小编 2026-06-26 阅读:758 评论:0
3.1神经网络概述(1)神经网络每个单元相当于一个逻辑回归,神经网络由逻辑回归的堆叠起来。下图是...

3.1神经网络概述

(1)神经网络每个单元相当于一个逻辑回归,神经网络由逻辑回归的堆叠起来。下图是网络结构:

吴恩达《深度学习》第一门课(3)浅层神经网络

针对网络结构进行计算:

1.第一层的正向传播

吴恩达《深度学习》第一门课(3)浅层神经网络

2.第一层的反向传播

吴恩达《深度学习》第一门课(3)浅层神经网络

3.第二层的反向传播(正向只要把微分符号去掉即可)

吴恩达《深度学习》第一门课(3)浅层神经网络

3.2神经网络的表示

(1)神经网络各层分别较输入层、掩藏层和输出层,其中说一个网络有几层时一般不包括输入层,如下图是一个两层的网络:

吴恩达《深度学习》第一门课(3)浅层神经网络

(2)a[0]chang也常用来表示输入特征,a[1]b表示第一层的输出,如第一层(不算输入层)有四个神经元,其输出为(用a表示是因为activation激活函数的缩写):

吴恩达《深度学习》第一门课(3)浅层神经网络

(3)关于W[m],b[m]是和第m层输出有关的系数,W的维度(第m层单元数,上一层单元数),b的维度为(第m层单元数,1)。

3.3计算一个神经元网络的输出

(1)神经结构如下:

吴恩达《深度学习》第一门课(3)浅层神经网络

 

(2)每一个神经元做的计算:

吴恩达《深度学习》第一门课(3)浅层神经网络

(2)向量化表示下面四个式子:

吴恩达《深度学习》第一门课(3)浅层神经网络

吴恩达《深度学习》第一门课(3)浅层神经网络

(3)一个输入样本,神经网络的计算

吴恩达《深度学习》第一门课(3)浅层神经网络

3.4多样本向量化

(1)多样本的计算示意图(a[2](1)前面的2表示第二层,后面的1表示第一个样本):

吴恩达《深度学习》第一门课(3)浅层神经网络

(2)向量化:

吴恩达《深度学习》第一门课(3)浅层神经网络

(3)以矩阵A为例,从水平上看,每一列对应着不同的训练样本;从垂直方向看,每一行对应着同一层的不同神经元。

3.5向量化实现的解释

(1)矩阵乘列向量得到列向量:

吴恩达《深度学习》第一门课(3)浅层神经网络

(2)上面式子中省略了b[1],b[1]的维度与Z[1]相同,再加上python具有广播的功能,所以可以使得向量b与每一列相加。

3.6激活函数

(1)sigmoid激活函数:除了输出层是一个二分类问题基本不会用它。存在梯度消失问题,其函数表达式如下:

吴恩达《深度学习》第一门课(3)浅层神经网络

(2)tanh激活函数:tanh是非常优秀的,可以中心化数据(-1到1),几乎适合所以场合。存在梯度消失问题,其函数表达式如下:

吴恩达《深度学习》第一门课(3)浅层神经网络

(3)ReLU激活函数:最常用的默认函数,如果不确定用哪个激活函数,就是用ReLU(函数表达式为a=max(0,z))或则Leaky ReLU(函数表达式为a=max(0.01z,z),0.01参数可改)。ReLU在负半区梯度为零,产生所谓的稀疏性,但由于有足够多的掩藏层是z大于0,所以学习过程还是非常的快。

(4)下面的四种激活函数的图像:

吴恩达《深度学习》第一门课(3)浅层神经网络

3.7为什么需要非线性激活函数

(1)如果没有非线性激活函数,那么无论网络有多少层,输出始终是输入的线性组合,与一层网络毫无区别。举例如下:

吴恩达《深度学习》第一门课(3)浅层神经网络

(2)有时候输出可能会用到线性激活函数。

3.8激活函数的导数

吴恩达《深度学习》第一门课(3)浅层神经网络

吴恩达《深度学习》第一门课(3)浅层神经网络

 吴恩达《深度学习》第一门课(3)浅层神经网络

吴恩达《深度学习》第一门课(3)浅层神经网络

3.9神经网络的梯度下降

(1)正向传播四个式子:

吴恩达《深度学习》第一门课(3)浅层神经网络

(2)反向传播六个式子(下面公式3.3.2中应该是dz[2]):

吴恩达《深度学习》第一门课(3)浅层神经网络

3.10(选修)直观理解反向传播

(1)主要推导过程:

吴恩达《深度学习》第一门课(3)浅层神经网络

3.11随机初始化

(1)W不能初始化为零否则一层中每个单元都做相同的计算,和一个单元没什么区别,b可以初始化为零。可按照如下方式初始化(0.01的作用是时输出不会太大,太大由由sigmoid、tanh激活函数是将会导致梯度特别小):

吴恩达《深度学习》第一门课(3)浅层神经网络

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

热门文章
  • 机房智能化温湿度解决方式之POE供电以太网温湿度传感器

    机房智能化温湿度解决方式之POE供电以太网温湿度传感器
    机房智能化温湿度解决方式之POE供电以太网温湿度传感器 北京盈创力和电子科技有限公司 智能型TCP网口温湿度记录仪 北京IP网络温湿度记录仪厂家,北京盈创力和 北京智能型TCP网口温湿度记录仪IP网络温湿度记录仪是一种新型的基于TCP/IP协议双绞线以太网标准温湿度采集模块,利用它可以实现现场温度值、相对湿度值的采集,同时利用其自身的RJ45通信接口可以方便地和机房监控主机或交换机集线器进行联网。 工作于-40℃~85℃工业级带...
  • Sequential Monte Carlo Methods (SMC) 序列蒙特卡洛/粒子滤波/Bootstrap Filtering

    Sequential Monte Carlo Methods (SMC) 序列蒙特卡洛/粒子滤波/Bootstrap Filtering
    Problem Statement 我们考虑一个具有马尔可夫性质、非线性、非高斯的状态空间模型(State Space Model):对于一个时间序列上的观测结果{yt,t∈N}\\{ y_t , t \\in N \\}{yt​,t∈N},我们认为每个观测结果yty_tyt​的生成依赖于一个无法直接观察的隐变量xt∈{xt,t∈N}x_t \\in \\{x_t , t \\in N \\}xt​∈{xt​,t∈N},即:p(...
  • HTTP状态保持的原理

    HTTP状态保持的原理
    a)在用户登录之后,浏览器返回响应的时候会在响应中添加上cookieb)浏览器接收到cookie之后会自动保存c)当用户再次请求同一服务器中的其他网页的时候,浏览器会自动带上之前保存的cookied)服务接收到请求之后可以请 request 对象中取到cookie 判断当前用户是否登录  Http是无状态的,就是连接时数据互通,关闭后...
  • Hive 系统函数及示例

    Hive 系统函数及示例
    查看所有系统函数 show functions; 函数分类 内置函数【系统函数】 数学函数: floor、round、ceil、cos、log2等 字符串函数: length、reverse、trim、lower、get_json_object、repeat等 收集函数: size 转换函数: cast 日期函数: year、month、datediff、date、date_add等 条件函数: coalesce、case…w...
  • CSRF的原理和防范措施

    CSRF的原理和防范措施
    a)攻击原理:i.用户C访问正常网站A时进行登录,浏览器保存A的cookieii.用户C再访问攻击网站B,网站B上有某个隐藏的链接或者图片标签会自动请求网站A的URL地址,例如表单提交,传指定的参数iii.而攻击网站B在访问网站A的时候,浏览器会自动带上网站A的cookieiv.所以网站A在接收到请求之后可判断当前用户是登录状态,所以...
标签列表