受限波尔兹曼机(Restricted Blotzmann Machine,RBM)是一种可用随机神经网络(stochastic neural network)来解释的概率图模型(probabilistic graphical model),由Smolensky在波尔兹曼机(Blotzmann Machine,BM)基础上提出,其输出只有激活与未激活两种状态,一般用1和0表示,具体取值依据概率统计法则决定。

基础知识

sigmoid函数

sigmoid(x)=11+exsigmoid(x)=\\frac{1}{1+e^{-x}}sigmoid(x)=1+ex1

Bayes定理

P(AB)=P(A)P(BA)P(B)P(A|B)=P(A)\\frac{P(B|A)}{P(B)}P(AB)=P(A)P(B)P(BA)
其中,P(A)P(A)P(A)称为先验概率(Prior probability),P(AB)P(A|B)P(AB)称为后验概率(Posterior probability)。

二分图

G=(V,E)G=(V,E)G=(V,E)为一个无向图,其中顶点集VVV可以分为两个互不相交的子集V1V_1V1V2V_2V2,对于每条边上两个顶点分别属于这两个顶点集,则称为一个二分图。

MCMC方法

随机算法可分为Las Vegas算法与蒙特卡罗算法,其中Las Vegas算法总是精准返回一个正确答案或者返回无解,占用计算资源(CPU、内存等)随机,而蒙特卡罗算法具有随机大小的错误,可以通过花费更多计算资源来稳定减小这种误差。蒙特卡罗方法核心问题为如何从分布上随机采样,一般采用马尔可夫链蒙特卡罗方法(Markov Chain Monte Carlo, MCMC)产生指定分布下样本。

蒙特卡罗采样

有的时候需要通过采样的方式以较小的代价处理一些问题,比如采用小批量计算梯度,或者比如近似一个难以处理的求和或积分。
比如
s=p(x)f(x)=Ep[f(x)]s=\\sum p(x)f(x)=E_p[f(x)]s=p(x)f(x)=Ep[f(x)]
或者
s=p(x)f(x)dx=Ep[f(x)]s=\\int p(x)f(x)dx=E_p[f(x)]s=p(x)f(x)dx=Ep[f(x)]
此时,可通过计算
s^n=1ni=1nf(x(i))\\hat{s}_n=\\frac{1}{n}\\sum\\limits_{i=1}\\limits^nf(x^{(i)})s^n=n1i=1nf(x(i))
依据大数定律,若x(i)x^{(i)}x(i)独立同分布,则其均值收敛于其期望值,即
limns^n=s\\lim\\limits_{n\\to \\infty}\\hat{s}_n=snlims^n=s
其方差
Var[s^n]=1n2i=1nVar[f(x)]=Var[f(x)]nVar[\\hat{s}_n]=\\frac{1}{n^2}\\sum\\limits_{i=1}\\limits^{n}Var[f(x)]=\\frac{Var[f(x)]}{n}Var[s^n]=n21i=1nVar[f(x)]=nVar[f(x)]
由中心极限定理,s^n\\hat{s}_ns^n收敛到以sss为均值以Var[f(x)]n\\frac{Var[f(x)]}{n}nVar[f(x)]为方差的正态分布,因此可用正态分布累积函数估计其置信区间。
补充:
[1]大数定律:样本量无穷大时,样本均值收敛于总体均值。(依概率收敛)
[2]中心极限定理:样本抽样分布接近于期望为u的正态分布。
[3]切比雪夫不等式:
P{Xμε}σ2ε2P\\{|X-\\mu|\\geq \\varepsilon\\}\\leq\\frac{\\sigma ^2}{\\varepsilon ^2}P{Xμε}ε2σ2

马尔科夫链

XtX_tXt表示随机变量XXX在离散时间ttt时刻的取值,若满足
P(Xt+1=sjX0=si0,X1=si1,...,Xt=si)=P(Xt+1=sjXt=si)P(X_{t+1}=s_j|X_0=s_{i0},X_1=s_{i1},...,X_t=s_i)=P(X_{t+1}=s_j|X_t=s_i)P(Xt+1=sjX0=si0,X1=si1,...,Xt=si)=P(Xt+1=sjXt=si)
则称该变量为马尔可夫变量,一段时间内变量XXX的取值序列称为马尔可夫链。
Pi,j=P(Xt+1=sjXt=si)P_{i,j}=P(X_{t+1}=s_j|X_t=s_i)Pi,j=P(Xt+1=sjXt=si)称为转移概率,πk(t)\\pi ^{(t)}_kπk(t)表示该随机变量在时刻ttt取值为sks_ksk的概率,则
πi(t+1)=kPk,iπk(t)\\pi_i^{(t+1)}=\\sum\\limits_kP_{k,i}\\pi_k^{(t)}πi

收藏 打印
您的足迹: