最大熵模型（Maximum Entropy Model）

一、最大熵原理

最大熵原理认为，在没有更多信息的情况下，不确定的部分都是等可能的（均匀分布），此时概率分布的熵最大。

假设输入实例 $\\bm x\\in\\R^n$ ，类别 $y\\in\\{c_1, c_2, \\cdots, c_K\\}$ ，若使用判别式模型 $P(y|\\bm x)$ 预测实例类别，在没有任何先验知识的情况下，认为实例 $\\bm x$ 等可能属于各类别，即
$P(c_1|\\bm x)=P(c_2|\\bm x)=\\cdots=P(c_K|\\bm x)=1/K$

此时类别服从均匀分布，分布的熵最大。

例1
假设随机变量 $X$ 取值集合 $\\mathcal X=\\{A, B, C, D, E\\}$ ，约束条件 $P(A) + P(B)=\\dfrac{3}{10}$ ， $\\sum\\limits_{x\\in\\mathcal X}P(x)=1$ ，估计各取值概率。
在缺少其他信息的情况下，认为 $A$ 与 $B$ 等概率， $C$ ， $D$ 与 $E$ 等概率，因此
$\\begin{aligned} & P(A)=P(B)=\\frac{3}{20}\\\\ & P(C)=P(D)=P(E)=\\frac{7}{30}\\end{aligned}$

二、最大熵模型

分类判别模型 $P(Y|X)$ ，其中输入 $X\\in\\mathcal X\\subset R^n$ ，输出 $Y\\in \\mathcal Y$ ，学习目标是选择熵最大的模型 $P(Y|X)$ 。

特征函数
定义特征函数 $f(\\bm x, y)$ 表示输入输出之间的某一事实，即
$f(\\bm x, y)=\\begin{cases} 1, &\\bm x与y满足某一事实\\\\ 0, &其他 \\end{cases}$

约束条件
给定训练集 $T=\\{(\\bm x_1, y_1), (\\bm x_2, y_2), \\cdots, (\\bm x_N, y_N)\\}$ ，则可得联合分布 $P(X, Y)$ 和边缘分布 $P(X)$ 的经验分布
$\\begin{aligned} & \\tilde P(X=\\bm x, Y=y)=\\frac{\\nu(X=\\bm x, Y=y)}{N}\\\\\\,\\\\ & \\tilde P(X=\\bm x)=\\frac{\\nu(X=\\bm x)}{N} \\end{aligned}$

式中 $\\nu$ 表示对应样本出现的次数。

特征函数 $f(\\bm x, y)$ 关于经验分布 $\\tilde P(X, Y)$ 的期望
$E_{\\tilde P}(f)=\\sum_{\\bm x, y}\\tilde P(\\bm x, y)f(\\bm x, y)$

特征函数 $f(\\bm x, y)$ 关于模型 $P(Y|X)$ 与经验分布 $\\tilde P(X)$ 的期望
$E_{P}(f)=\\sum_{\\bm x, y}\\tilde P(\\bm x)P(y|\\bm x)f(\\bm x, y)$

最大熵模型（Maximum Entropy Model）

浏览：1288 2026-05-07

二、最大熵模型

继续阅读与本文标签相同的文章

MXC抹茶基金宣布战略投资区块链内容社区芥末圈

最后一公里的自动驾驶：自动代客泊车要来了吗

特别推荐 2026年05月18日星期一

精彩发现

热门标签

最大熵模型（Maximum Entropy Model）

浏览：1288 2026-05-07

二、最大熵模型

继续阅读与本文标签相同的文章

2026-05-18栏目： 教程

2026-05-18栏目： 教程

2026-05-18栏目： 教程

2026-05-18栏目： 教程

2026-05-18栏目： 教程

2026-04-23栏目： 教程

2026-04-23栏目： 教程

2026-04-23栏目： 教程

2026-04-23栏目： 教程

2026-04-24栏目： 教程

特别推荐 2026年05月18日 星期一

精彩发现

热门标签

相关文章

2026-05-18栏目：教程

2026-05-18栏目：教程

2026-05-18栏目：教程

2026-05-18栏目：教程

2026-05-18栏目：教程

2026-04-23栏目：教程

2026-04-23栏目：教程

2026-04-23栏目：教程

2026-04-23栏目：教程

2026-04-24栏目：教程

特别推荐 2026年05月18日星期一