受限波尔兹曼机(Restricted Blotzmann Machine,RBM)是一种可用随机神经网络(stochastic neural network)来解释的概率图模型(probabilistic graphical model),由Smolensky在波尔兹曼机(Blotzmann Machine,BM)基础上提出,其输出只有激活与未激活两种状态,一般用1和0表示,具体取值依据概率统计法则决定。
基础知识
sigmoid函数
sigmoid(x)=1+e−x1
Bayes定理
P(A∣B)=P(A)P(B)P(B∣A)
其中,P(A)称为先验概率(Prior probability),P(A∣B)称为后验概率(Posterior probability)。
二分图
G=(V,E)为一个无向图,其中顶点集V可以分为两个互不相交的子集V1、V2,对于每条边上两个顶点分别属于这两个顶点集,则称为一个二分图。
MCMC方法
随机算法可分为Las Vegas算法与蒙特卡罗算法,其中Las Vegas算法总是精准返回一个正确答案或者返回无解,占用计算资源(CPU、内存等)随机,而蒙特卡罗算法具有随机大小的错误,可以通过花费更多计算资源来稳定减小这种误差。蒙特卡罗方法核心问题为如何从分布上随机采样,一般采用马尔可夫链蒙特卡罗方法(Markov Chain Monte Carlo, MCMC)产生指定分布下样本。
蒙特卡罗采样
有的时候需要通过采样的方式以较小的代价处理一些问题,比如采用小批量计算梯度,或者比如近似一个难以处理的求和或积分。
比如
s=∑p(x)f(x)=Ep[f(x)]
或者
s=∫p(x)f(x)dx=Ep[f(x)]
此时,可通过计算
s^n=n1i=1∑nf(x(i))
依据大数定律,若x(i)独立同分布,则其均值收敛于其期望值,即
n→∞lims^n=s
其方差
Var[s^n]=n21i=1∑nVar[f(x)]=nVar[f(x)]
由中心极限定理,s^n收敛到以s为均值以nVar[f(x)]为方差的正态分布,因此可用正态分布累积函数估计其置信区间。
补充:
[1]大数定律:样本量无穷大时,样本均值收敛于总体均值。(依概率收敛)
[2]中心极限定理:样本抽样分布接近于期望为u的正态分布。
[3]切比雪夫不等式:
P{∣X−μ∣≥ε}≤ε2σ2
马尔科夫链
令Xt表示随机变量X在离散时间t时刻的取值,若满足
P(Xt+1=sj∣X0=si0,X1=si1,...,Xt=si)=P(Xt+1=sj∣Xt=si)
则称该变量为马尔可夫变量,一段时间内变量X的取值序列称为马尔可夫链。
Pi,j=P(Xt+1=sj∣Xt=si)称为转移概率,πk(t)表示该随机变量在时刻t取值为sk的概率,则
πi
继续阅读与本文标签相同的文章
-
两问快递涨价
2026-05-19栏目: 教程
-
一图了解顺丰全球供应链网络布局
2026-05-19栏目: 教程
-
这款 IDE 插件再次升级,让「小程序云」的开发部署提速 8 倍
2026-05-19栏目: 教程
-
专注于技术能力提升的央企,注定不平凡,我有看点!
2026-05-19栏目: 教程
-
男友力爆棚的Mac电脑办公软件WPS Office
2026-05-19栏目: 教程
