别再死记硬背EM算法了！用Python手写一个硬币实验，5分钟搞懂E步和M步

张

张建站

2026/5/24 7:32:16

10分钟阅读

用Python实现EM算法从硬币实验到高斯混合模型实战很多人在学习EM算法时都会被复杂的数学推导劝退。但今天我要带你用Python手写一个硬币实验通过不到50行代码直观理解E步和M步的奥妙。我们不仅会复现经典的双硬币问题还会延伸到scikit-learn中的高斯混合模型应用让你真正掌握这个算法的精髓。1. 准备工作理解问题场景假设你面前有两个不均匀的硬币A和B但每次投掷时都有人随机选择一个硬币给你你不知道是哪个。你记录了5轮投掷结果每轮投掷10次第一轮5正5反第二轮9正1反第三轮8正2反第四轮4正6反第五轮7正3反我们的目标是通过这些观测数据估计出硬币A和B各自的正面向上的概率θₐ和θᵦ。这就是典型的含有隐变量每次选择的硬币的参数估计问题正是EM算法大显身手的地方。核心工具准备import numpy as np from collections import defaultdict import matplotlib.pyplot as plt2. EM算法实现从理论到代码2.1 初始化参数我们随机初始化两个硬币的正面向上的概率并定义观测数据# 初始猜测 theta_A 0.6 # 硬币A正面向上的初始概率 theta_B 0.5 # 硬币B正面向上的初始概率 # 观测数据每轮投掷的正反面次数 observations np.array([ [5, 5], # 第一轮 [9, 1], # 第二轮 [8, 2], # 第三轮 [4, 6], # 第四轮 [7, 3] # 第五轮 ])2.2 E步计算隐变量分布E步的核心是计算在当前参数下每轮投掷来自硬币A或B的概率def e_step(obs, theta_a, theta_b): # 计算每轮来自A和B的概率 prob_A np.zeros(len(obs)) prob_B np.zeros(len(obs)) for i, (h, t) in enumerate(obs): # 计算似然P(data|θ) likelihood_A (theta_a**h) * ((1-theta_a)**t) likelihood_B (theta_b**h) * ((1-theta_b)**t) # 归一化得到概率 total likelihood_A likelihood_B prob_A[i] likelihood_A / total prob_B[i] likelihood_B / total return prob_A, prob_B2.3 M步更新参数估计M步则根据E步得到的概率重新估计θₐ和θᵦdef m_step(obs, prob_A, prob_B): # 计算加权后的正反面次数 total_A_h 0 total_A_t 0 total_B_h 0 total_B_t 0 for (h, t), pa, pb in zip(obs, prob_A, prob_B): total_A_h h * pa total_A_t t * pa total_B_h h * pb total_B_t t * pb # 更新参数 new_theta_A total_A_h / (total_A_h total_A_t) new_theta_B total_B_h / (total_B_h total_B_t) return new_theta_A, new_theta_B2.4 迭代过程可视化让我们运行10次迭代并观察参数的变化history {A: [], B: []} for _ in range(10): # E步 prob_A, prob_B e_step(observations, theta_A, theta_B) # M步 theta_A, theta_B m_step(observations, prob_A, prob_B) # 记录历史 history[A].append(theta_A) history[B].append(theta_B) # 绘制收敛过程 plt.plot(history[A], labelCoin A) plt.plot(history[B], labelCoin B) plt.xlabel(Iteration) plt.ylabel(Estimated Probability) plt.legend() plt.show()运行后你会发现经过几次迭代后θₐ和θᵦ就会收敛到稳定值。在我的实验中最终收敛到硬币A正面概率≈0.71硬币B正面概率≈0.583. 算法原理解析3.1 为什么EM能解决这类问题EM算法之所以能处理含有隐变量的问题关键在于它通过迭代的方式逐步逼近真实参数E步基于当前参数计算隐变量的后验分布即我们的prob_A和prob_BM步基于这个分布更新参数使期望似然最大化这个过程就像是在不断猜测隐变量的值E步然后基于这个猜测优化参数M步如此循环直到收敛。3.2 数学保证EM算法有一个美妙的性质每次迭代都会保证对数似然函数不减。这是因为E步构建了一个对数似然的下界函数Q函数M步通过最大化这个下界函数来提升原始似然用数学表示就是logP(X|θ⁽ᵗ⁺¹⁾) ≥ logP(X|θ⁽ᵗ⁾)4. 工业级应用高斯混合模型理解了硬币问题后我们来看一个更实际的例子——高斯混合模型(GMM)。在scikit-learn中GMM就是使用EM算法实现的from sklearn.mixture import GaussianMixture # 生成模拟数据 np.random.seed(42) data np.concatenate([ np.random.normal(0, 1, 300), np.random.normal(5, 1.5, 200) ])[:, np.newaxis] # 使用EM算法拟合GMM gmm GaussianMixture(n_components2, max_iter100) gmm.fit(data) print(f均值: {gmm.means_.ravel()}) print(f方差: {gmm.covariances_.ravel()})这里EM算法的工作流程与硬币问题惊人地相似E步计算每个数据点属于各个高斯分布的概率M步基于这些概率重新估计高斯分布的参数5. 实战技巧与常见问题5.1 EM算法的局限性虽然EM算法很强大但也有几点需要注意初始值敏感不同的初始值可能导致收敛到不同的局部最优解收敛速度有时收敛较慢特别是接近最优解时隐变量选择需要合理设计隐变量结构5.2 改进策略针对这些问题可以尝试以下方法多次初始化随机初始化多次选择似然最大的结果加速技巧使用加速EM变种或结合梯度方法模型选择通过BIC等准则确定合适的隐变量维度# 示例使用BIC选择GMM的最佳组件数 bic_values [] n_components_range range(1, 8) for n_components in n_components_range: gmm GaussianMixture(n_componentsn_components) gmm.fit(data) bic_values.append(gmm.bic(data)) best_n n_components_range[np.argmin(bic_values)] print(f最佳组件数: {best_n})6. 扩展应用场景EM算法在机器学习中有着广泛的应用以下是一些典型例子缺失数据处理将缺失值视为隐变量文本建模主题模型中的LDA算法计算机视觉图像分割中的混合模型生物信息学基因序列分析比如在主题模型中E步计算文档中每个词属于各个主题的概率M步则更新主题的词分布和文档的主题分布。这与我们的硬币问题在数学形式上高度一致。

半监督学习在海洋异常检测中的实践与优化

1. 海洋异常检测中的半监督学习实践在遥感图像分析领域，海洋异常检测一直是个具有挑战性的任务。传统全监督学习方法需要大量标注数据，而像素级标注的成本往往令人望而却步。最近我在一个海洋监测项目中尝试了FixMatch半监督学习方法，对比了…...

2026/5/24 7:31:15 阅读更多 →

归一化评估指标：解决小数据与不平衡数据模型评估难题

1. 项目概述与核心痛点在机器学习项目的实际落地过程中，尤其是在数据科学竞赛之外的工业界场景，我们常常会遇到一个令人头疼的困境：手头的数据集要么样本量稀少，要么类别分布严重失衡。这时候，你满怀信心地训练了一个模…...

2026/5/24 7:29:11 阅读更多 →

DS-5调试器实现重定位代码源码级调试详解

1. DS-5调试器对重定位代码的源码级调试支持在嵌入式系统开发中，代码重定位（Code Relocation）是一个常见需求。所谓重定位，指的是将编译生成的代码从它原本链接的地址移动到内存中的另一个位置执行。这种情况在bootloader开发、操…...

2026/5/24 7:18:30 阅读更多 →

Oracle EBS R12 主 / 辅助分类帐（主 / 辅助帐套）

Oracle EBS R12 主 / 辅助分类帐（主 / 辅助帐套）落地全套文档包含：配置清单、科目映射规则模板、4 类典型调整分录、税会 / IFRS 案例分录，可直接用于实施、方案文档、上线配置。说明：R11 帐套 (SOB)、R12 分类帐 (Led…...

2026/5/24 0:28:44 阅读更多 →

Harness的配置漂移检测与自动修复

云原生时代的稳定性利器：Harness配置漂移检测与自动修复全指南引言痛点引入相信每一位DevOps工程师、SRE或者运维负责人都遇到过这样的噩梦： 测试环境验证了3天的功能，上线到生产10分钟就出现503错误，排查了2小时才发现&…...

2026/5/24 0:34:52 阅读更多 →

【工程实践】代码质量与测试策略：构建可靠的软件交付体系

【工程实践】代码质量与测试策略：构建可靠的软件交付体系引言代码质量是软件项目成功的关键因素之一。良好的代码质量不仅能提高开发效率，还能降低维护成本，提升系统的可靠性。本文将详细介绍代码质量保障和测试策略的最佳实践。一、代码质…...

2026/5/24 0:37:09 阅读更多 →

3分钟快速上手OBS多平台同步直播插件：告别重复配置，一键推流到多个平台

3分钟快速上手OBS多平台同步直播插件：告别重复配置，一键推流到多个平台【免费下载链接】obs-multi-rtmp OBS複数サイト同時配信プラグイン项目地址: https://gitcode.com/gh_mirrors/ob/obs-multi-rtmp 你是否曾经为在不同直播平台同步推流而烦…...

2026/5/24 0:43:15 阅读更多 →