别再死记硬背公式了！用Python的NumPy和Matplotlib直观理解二维随机变量

张

张建站

2026/4/8 18:48:41

10分钟阅读

别再死记硬背公式了！用Python的NumPy和Matplotlib直观理解二维随机变量

用Python可视化二维随机变量从数学公式到三维图形的降维打击当你第一次在概率论课本上看到联合概率密度函数这个术语时是否感觉像在解读外星文字那些晦涩的数学符号和复杂的积分运算往往让学习者陷入公式记忆的泥潭。现在让我们换一种方式——用Python的NumPy和Matplotlib让这些抽象概念变成可以旋转、缩放、甚至能与之交互的三维图形。二维随机变量的核心在于理解两个随机变量之间的关联性。传统教学通常从数学定义出发先讲理论再给例子。我们今天要反其道而行之先看到图形再理解背后的数学原理。这种方法特别适合视觉型学习者也符合现代数据科学实践中先探索后理论的工作流程。1. 环境配置与基础准备在开始之前确保你的Python环境已经安装了科学计算三件套NumPy、Matplotlib和SciPy。如果你使用Anaconda这些库应该已经预装好了。打开Jupyter Notebook我强烈推荐这个交互式环境让我们先导入必要的工具import numpy as np import matplotlib.pyplot as plt from scipy.stats import multivariate_normal from mpl_toolkits.mplot3d import Axes3D plt.style.use(seaborn) # 使用更美观的绘图风格理解二维随机变量的第一步是创建一个二维概率分布。我们以最常用的二维正态分布为例。下面的代码创建了一个均值为[0,0]协方差矩阵为[[1,0.5],[0.5,1]]的二维正态分布mean [0, 0] cov [[1, 0.5], [0.5, 1]] # 对角线是方差非对角线是协方差 rv multivariate_normal(mean, cov)协方差矩阵的非对角元素决定了两个随机变量的相关性这里设为0.5表示中等程度的正相关。2. 三维曲面图看见概率密度现在让我们把这个二维概率密度函数可视化出来。三维图形能最直观地展示概率密度在不同区域的高低起伏。x np.linspace(-3, 3, 100) y np.linspace(-3, 3, 100) X, Y np.meshgrid(x, y) Z rv.pdf(np.dstack((X, Y))) fig plt.figure(figsize(12, 6)) ax fig.add_subplot(111, projection3d) ax.plot_surface(X, Y, Z, cmapviridis, edgecolornone) ax.set_xlabel(X轴) ax.set_ylabel(Y轴) ax.set_zlabel(概率密度) ax.set_title(二维正态分布的概率密度曲面) plt.show()这段代码会生成一个可以旋转的3D图形你会看到曲面在中心(0,0)处达到最高点向四周逐渐降低由于X和Y正相关曲面沿yx方向被拉长概率密度函数的积分曲面下的体积等于1关键观察点曲面的高度表示该点(X,Y)出现的相对可能性等高线可以看作概率密度的等高线相关性体现在曲面的拉伸方向上3. 二维等高线图概率地图对于不习惯看3D图形的人等高线图提供了另一种直观的展示方式。它就像概率密度的地形图plt.figure(figsize(8, 6)) contour plt.contour(X, Y, Z, levels10, cmapRdYlBu) plt.clabel(contour, inlineTrue, fontsize8) plt.scatter(mean[0], mean[1], cred, s100, label均值点) plt.xlabel(X) plt.ylabel(Y) plt.title(二维正态分布的等高线图) plt.colorbar(label概率密度) plt.legend() plt.grid(True) plt.show()从等高线图中你可以清晰地看到同心椭圆表示相同概率密度的区域椭圆的长轴方向反映了变量的相关性颜色变化直观显示了概率密度的衰减提示在Jupyter Notebook中可以尝试使用%matplotlib widget魔法命令获得可交互的图形实时缩放和平移来探索细节。4. 随机采样与点云可视化理论很重要但看到实际数据点更能加深理解。让我们从这个分布中随机抽取1000个样本点samples rv.rvs(size1000) plt.figure(figsize(10, 8)) plt.scatter(samples[:, 0], samples[:, 1], alpha0.5, cnp.exp(-rv.pdf(samples)), cmapviridis) plt.xlabel(X) plt.ylabel(Y) plt.title(二维正态分布的随机样本点云) plt.colorbar(label概率密度) plt.grid(True) # 添加均值线 plt.axhline(0, colorred, linestyle--, alpha0.5) plt.axvline(0, colorred, linestyle--, alpha0.5)观察点云图你会发现点密度高的区域对应概率密度大的区域点云呈椭圆形分布印证了X和Y的相关性大多数点集中在均值附近远离均值的点越来越少5. 边缘分布与条件分布的可视化二维随机变量的两个重要衍生概念是边缘分布和条件分布。让我们用图形来理解它们边缘分布可视化fig, (ax1, ax2) plt.subplots(1, 2, figsize(12, 5)) # X的边缘分布 x_vals np.linspace(-3, 3, 100) x_pdf rv.pdf(np.column_stack((x_vals, np.zeros_like(x_vals)))) ax1.plot(x_vals, x_pdf, labelX边缘分布) ax1.set_title(X的边缘概率密度) ax1.legend() # Y的边缘分布 y_vals np.linspace(-3, 3, 100) y_pdf rv.pdf(np.column_stack((np.zeros_like(y_vals), y_vals))) ax2.plot(y_vals, y_pdf, colororange, labelY边缘分布) ax2.set_title(Y的边缘概率密度) ax2.legend() plt.tight_layout() plt.show()边缘分布图展示了不考虑另一个变量时单个变量的概率分布。你会注意到两个边缘分布都是标准正态分布这与我们设定的协方差矩阵对角线元素为1一致条件分布可视化条件分布更有意思它展示了在一个变量取特定值时另一个变量的分布# 固定Y1时X的条件分布 y_condition 1 x_cond np.linspace(-3, 3, 100) cond_pdf [rv.pdf([x, y_condition])/rv.pdf([0, y_condition]) for x in x_cond] plt.figure(figsize(8, 5)) plt.plot(x_cond, cond_pdf, labelfX|Y{y_condition}) plt.title(f条件分布给定Y{y_condition}时X的分布) plt.xlabel(X) plt.ylabel(概率密度) plt.legend() plt.grid(True) plt.show()条件分布揭示了变量间的依赖关系。当Y被固定时X的分布会发生变化均值会向Y的值方向移动方差会减小因为Y的信息减少了不确定性6. 自定义分布与蒙特卡洛模拟为了更深入理解让我们创建一个非标准的二维分布并用蒙特卡洛方法进行模拟。假设我们定义如下密度函数f(x,y) k * exp(-(x² y² xy))其中k是归一化常数def custom_pdf(x, y): return np.exp(-(x**2 y**2 x*y)) # 蒙特卡洛积分计算归一化常数k n_samples 100000 x_samples np.random.uniform(-5, 5, n_samples) y_samples np.random.uniform(-5, 5, n_samples) k 1 / np.mean(custom_pdf(x_samples, y_samples)) * (1/10)**2 # 绘制自定义分布 x np.linspace(-3, 3, 100) y np.linspace(-3, 3, 100) X, Y np.meshgrid(x, y) Z k * custom_pdf(X, Y) fig plt.figure(figsize(12, 5)) ax1 fig.add_subplot(121, projection3d) ax1.plot_surface(X, Y, Z, cmapplasma) ax1.set_title(自定义二维分布3D视图) ax2 fig.add_subplot(122) contour ax2.contour(X, Y, Z, levels10, cmapplasma) ax2.clabel(contour, inlineTrue, fontsize8) ax2.set_title(自定义二维分布等高线) plt.tight_layout() plt.show()这个练习展示了如何定义任意的二维概率密度函数使用蒙特卡洛方法计算归一化常数可视化非标准分布的形状7. 从图形回到数学理解背后的理论经过前面的可视化探索现在让我们回到数学定义你会发现这些公式变得亲切多了联合概率密度函数 f(x,y)描述的是在点(x,y)处的概率密度满足 ∫∫ f(x,y) dxdy 1边缘分布 f_X(x) ∫ f(x,y) dy 这正是我们在第5节边缘分布图中看到的曲线。条件分布 f_{X|Y}(x|y) f(x,y)/f_Y(y) 这个公式解释了为什么我们在条件分布可视化中要除以f_Y(y)。协方差矩阵 Σ [[σ_x², ρσ_xσ_y], [ρσ_xσ_y, σ_y²]] 它决定了我们看到的3D曲面的形状和方向。通过这种先图形后理论的学习路径抽象的概念变得具体可感。当你在考试中遇到相关题目时脑海中会自然浮现出这些图形而不是干巴巴的公式。

ESP32-C3轻量BLE外设开发库BLE-Kit4C3详解

1. 项目概述BLE-Kit4C3 是一款专为 ESP32-C3 芯片设计的轻量级 Bluetooth Low Energy（BLE）嵌入式开发库，其核心目标是显著降低 BLE 外设（Peripheral）设备的开发门槛。该库完全基于 ESP-IDF v5.x 官方 BLE 协议栈&#…...

2026/4/8 18:44:55 阅读更多 →

JMS, ActiveMQ 学习一则狙

开发个什么Skill呢？ 通过 Skill，我们可以将某些能力进行模块化封装，从而实现特定的工作流编排、专家领域知识沉淀以及各类工具的集成。这里我打算来一次“套娃式”的实践：创建一个用于自动生成 Skill 的 Skill，一是用…...

2026/4/8 18:43:36 阅读更多 →

接口测试——pytest框架续集儇

智能体时代的代码范式转移与 C# 的战略转型传统的 C# 开发模式，即所谓的“工程导向型”开发，要求开发者创建一个复杂的项目结构，包括项目文件（.csproj）、解决方案文件（.sln）、属性设置以及依赖…...

2026/4/8 18:43:35 阅读更多 →

Flutter Riverpod：状态管理的新纪元

Flutter Riverpod：状态管理的新纪元告别 Provider 的繁琐，拥抱 Riverpod 的简洁与强大。一、为什么选择 Riverpod？ 作为一名追求代码如散文般优雅的 UI 匠人，我对状态管理工具有着近乎偏执的要求。Riverpod 不仅解决了 Provider 的…...

2026/4/7 20:28:44 阅读更多 →

【Scala深度学习】PyTorch On Scala3 系列课程第一章 01 ：入门与环境搭建【Ai Infra 3.0】[PyTorch Scala3 硕士研一课程]

章节 1: PyTorch ON Scala3入门与环境搭建本章将为PyTorch的使用做好准备。我们首先会配置必要的软件和环境。接着，主要内容将转向PyTorch的核心数据结构：张量。您将学习如何： 使用常用包管理器安装PyTorch。配置适合PyTorch项目的开发环…...

2026/4/7 21:19:26 阅读更多 →

STM32开发必备的C语言核心技巧与实战解析

1. STM32开发中的C语言核心知识点解析作为一名嵌入式开发者，我经常遇到初学者询问如何快速掌握STM32开发所需的C语言知识。今天我就结合自己多年的实战经验，整理出一份STM32开发中最关键的C语言知识点指南。这些内容不仅适合初学者系统学习，也…...

2026/4/7 17:54:53 阅读更多 →

Linux命令-nano（字符终端文本编辑器）

nano 是 Linux 系统中一个简单易用的命令行文本编辑器，以其直观的界面和易用性而闻名，特别适合初学者和快速编辑任务。它是 GNU 项目的一部分，替代了早期的 pico 编辑器。 📖 基本语法 nano [选项] [文件名]重要特性： …...

2026/4/7 14:19:47 阅读更多 →

更多精彩文章