别再死记硬背L1和L2了！用Python可视化带你直观理解Lp范数（附代码）

张

张建站

2026/6/3 6:32:13

10分钟阅读

用Python动态可视化揭开Lp范数的几何奥秘第一次接触机器学习中的正则化时那些数学公式总让人望而生畏。直到有一天我尝试用Python绘制出L1和L2范数的等高线图那些抽象的概念突然变得触手可及。本文将带你用代码和可视化工具直观理解不同p值下Lp范数的几何特性以及它们在正则化中扮演的关键角色。1. Lp范数基础与几何表现Lp范数是向量空间中衡量向量大小的通用方法定义为各元素绝对值的p次方和的p次方根。数学表达式为||x||_p (|x₁|^p |x₂|^p ... |xₙ|^p)^(1/p)当p取不同值时范数展现出截然不同的几何特性。让我们用Python绘制几种常见范数的等高线图import numpy as np import matplotlib.pyplot as plt from matplotlib.patches import Circle, Rectangle def plot_norm_contours(): fig, ax plt.subplots(figsize(12, 6)) # L1范数菱形 diamond plt.Polygon([(1,0), (0,1), (-1,0), (0,-1)], closedTrue, fillFalse, colorred, linewidth2) ax.add_patch(diamond) # L2范数圆形 circle Circle((0,0), 1, fillFalse, colorblue, linewidth2) ax.add_patch(circle) # L∞范数正方形 square Rectangle((-1,-1), 2, 2, fillFalse, colorgreen, linewidth2) ax.add_patch(square) ax.set_xlim(-1.5, 1.5) ax.set_ylim(-1.5, 1.5) ax.set_aspect(equal) ax.grid(True) plt.legend([L1范数, L2范数, L∞范数]) plt.title(不同Lp范数的单位球比较) plt.show() plot_norm_contours()这段代码生成了三种常见范数的单位球范数等于1的所有点构成的图形L1范数红色菱形各顶点位于坐标轴上这是稀疏解的关键L2范数蓝色圆形平滑的曲线没有突出点L∞范数绿色正方形边平行于坐标轴注意单位球的形状会随着维度增加而变化但在二维空间中已经能清晰展示核心差异2. 动态探索不同p值的Lp范数为了更深入理解p值如何影响范数形状我们可以创建一个交互式可视化工具import ipywidgets as widgets from IPython.display import display def lp_norm(x, y, p): return (abs(x)**p abs(y)**p)**(1/p) def plot_lp_contour(p2): x np.linspace(-1, 1, 100) y np.linspace(-1, 1, 100) X, Y np.meshgrid(x, y) Z lp_norm(X, Y, p) plt.figure(figsize(8,8)) plt.contour(X, Y, Z, levels[1], colorsb) plt.xlim(-1.5, 1.5) plt.ylim(-1.5, 1.5) plt.gca().set_aspect(equal) plt.title(fL{p}范数的单位等高线) plt.grid(True) plt.show() p_slider widgets.FloatSlider(value2, min0.1, max10, step0.1, descriptionp值:) widgets.interactive(plot_lp_contour, pp_slider)通过滑动条调整p值你会观察到当p接近0时等高线趋向于十字形虽然L0严格来说不是范数p1时形成完美的菱形p2时是标准的圆形p增大时逐渐向正方形靠拢p→∞时完全变成正方形L∞范数这种动态可视化让我们直观理解为什么不同范数会导致不同的优化行为。3. L1与L2正则化的几何解释正则化在机器学习中用于防止过拟合而L1和L2正则化的不同效果可以从几何角度清晰理解。考虑一个简单的线性回归问题def plot_regularization_effect(): # 生成一些随机数据 np.random.seed(42) X np.random.rand(20, 1) y 2 * X.squeeze() np.random.normal(0, 0.1, 20) # 计算不同正则化下的解 from sklearn.linear_model import Lasso, Ridge l1 Lasso(alpha0.1).fit(X, y).coef_ l2 Ridge(alpha0.1).fit(X, y).coef_ # 绘制结果 plt.figure(figsize(10,6)) plt.scatter(X, y, label数据点) x_vals np.array([0, 1]) plt.plot(x_vals, 2*x_vals, k--, label真实关系) plt.plot(x_vals, l1*x_vals, r-, labelL1正则化) plt.plot(x_vals, l2*x_vals, b-, labelL2正则化) plt.legend() plt.title(L1与L2正则化效果比较) plt.show() plot_regularization_effect()从几何角度看正则化相当于在原始损失函数上增加一个约束L1正则化解被推向坐标轴产生稀疏性L2正则化解被均匀缩小保持所有特征都有小权重这种差异源于它们的单位球形状L1的尖角使得与等高线的交点更可能出现在坐标轴上。4. 实际应用中的选择策略理解了Lp范数的几何特性后我们来看实际应用中如何选择特性L1正则化L2正则化解的形状稀疏许多参数为0稠密所有参数都较小计算效率适合特征选择适合防止过拟合鲁棒性对异常值更鲁棒对异常值较敏感适用场景高维数据、特征选择中小规模数据、共线性问题在Python中实现时可以结合两种范数的优点from sklearn.linear_model import ElasticNet # 弹性网络结合L1和L2 model ElasticNet(alpha0.1, l1_ratio0.5) model.fit(X_train, y_train)提示在实际项目中我通常先用L2正则化建立基线模型当特征维度很高时再尝试L1或弹性网络5. 多维空间中的可视化技巧对于更高维度的理解我们可以使用投影和切片技术。以下代码展示如何可视化三维Lp范数def plot_3d_norm(p2): from mpl_toolkits.mplot3d import Axes3D x np.linspace(-1, 1, 50) y np.linspace(-1, 1, 50) z np.linspace(-1, 1, 50) X, Y, Z np.meshgrid(x, y, z) # 计算3D Lp范数 W (np.abs(X)**p np.abs(Y)**p np.abs(Z)**p)**(1/p) fig plt.figure(figsize(10,8)) ax fig.add_subplot(111, projection3d) # 绘制等值面 verts, faces measure.marching_cubes(W, level1) ax.plot_trisurf(verts[:, 0], verts[:,1], faces, verts[:, 2], cmapSpectral, lw1) ax.set_title(f3D L{p}范数单位球) plt.show() plot_3d_norm(p1) # 尝试改变p值观察形状变化随着维度增加L1范数单位球的尖角效应更加明显这解释了为什么在高维空间中L1正则化更容易产生稀疏解。6. 从几何到优化实际训练中的观察在实际模型训练过程中不同范数正则化会导致不同的优化轨迹。我们可以用优化路径图来展示这一现象def plot_optimization_path(): # 创建一个简单的二次优化问题 A np.array([[3, 0.5], [0.5, 1]]) b np.array([1, 2]) # 定义损失函数和正则化项 def loss(w, reg, p): return 0.5 * w.T A w - b.T w reg * np.sum(np.abs(w)**p) # 生成网格 w1 np.linspace(-2, 2, 100) w2 np.linspace(-2, 2, 100) W1, W2 np.meshgrid(w1, w2) # 计算不同正则化的损失 loss_l1 np.array([loss(np.array([w1,w2]), 0.5, 1) for w1, w2 in zip(W1.ravel(), W2.ravel())]).reshape(W1.shape) loss_l2 np.array([loss(np.array([w1,w2]), 0.5, 2) for w1, w2 in zip(W1.ravel(), W2.ravel())]).reshape(W1.shape) # 绘制等高线 plt.figure(figsize(12,5)) plt.subplot(121) plt.contour(W1, W2, loss_l1, levels20) plt.title(L1正则化优化路径) plt.scatter([0], [0], cred) # L1最优解通常在坐标轴上 plt.subplot(122) plt.contour(W1, W2, loss_l2, levels20) plt.title(L2正则化优化路径) plt.scatter([0.35], [1.65], cred) # L2最优解 plt.tight_layout() plt.show() plot_optimization_path()从图中可以清晰看到L1正则化的最优解往往位于坐标轴上稀疏性L2正则化的最优解通常位于某个内部点优化算法在L1情况下的路径会突然拐弯朝向坐标轴7. 超越欧几里得自定义范数的实践有时标准Lp范数不能满足需求我们可以定义自己的范数。例如在图像处理中可能需要对不同方向的梯度使用不同范数def custom_norm(x, y, px2, py1): x方向用L2y方向用L1的混合范数 return (abs(x)**px abs(y)**py)**(1/max(px,py)) def plot_custom_norm(): x np.linspace(-1, 1, 100) y np.linspace(-1, 1, 100) X, Y np.meshgrid(x, y) Z custom_norm(X, Y) plt.figure(figsize(8,8)) plt.contour(X, Y, Z, levels[1], colorspurple) plt.title(自定义混合范数 (x:L2, y:L1)) plt.grid(True) plt.show() plot_custom_norm()这种灵活性让我们可以根据具体问题设计合适的正则化方式。在计算机视觉项目中我经常使用这种各向异性范数来处理不同方向的特征。

告别重复输入密码：用SSH-Agent管理你的GitHub、GitLab和Hugging Face密钥

多平台SSH密钥管理实战：用SSH-Agent统一GitHub、GitLab与Hugging Face认证每次提交代码到GitHub、同步项目到GitLab或从Hugging Face拉取模型时，重复输入密码是否让你感到效率低下？作为开发者，我们平均每天要与多个代码托管和AI平…...

2026/6/3 6:32:10 阅读更多 →

告别API调用费：用Hugging Face和Gemma-7B-IT打造你的本地AI聊天助手（附完整代码）

零成本构建企业级AI助手：基于Hugging Face与Gemma-7B的私有化部署实战在云计算服务按调用次数收费的时代，许多开发者发现随着业务规模扩大，API调用成本正成为不可忽视的支出。更关键的是，敏感数据通过第三方服务传输带来的隐私风…...

2026/6/3 6:31:32 阅读更多 →

ArcGIS新手必看：手把手教你从零创建林地小班shp矢量图（附坐标设置避坑指南）

ArcGIS零基础实战：林地小班矢量图创建全流程详解刚接触ArcGIS的林业工作者常被各种专业术语和复杂界面吓退，但掌握基础矢量图创建技能其实并不难。本文将带您从软件安装后的第一个空白界面开始，一步步完成林地小班shp文件的创建，特…...

2026/6/3 6:30:20 阅读更多 →

量子误差缓解技术：原理、应用与优化

1. 量子误差缓解技术概述量子计算在NISQ（含噪中等规模量子）时代面临的核心挑战之一是量子噪声对计算结果的干扰。误差缓解技术作为当前最实用的解决方案，能够在硬件层面纠错技术成熟前，显著提升量子算法的执行精度。与传统纠错不同…...

2026/6/2 9:54:07 阅读更多 →

从新手到专家：Ryzen SDT调试工具完整指南，轻松解锁AMD处理器隐藏性能

从新手到专家：Ryzen SDT调试工具完整指南，轻松解锁AMD处理器隐藏性能【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Tabl…...

2026/6/2 11:40:26 阅读更多 →

如何用Poppins字体解决多语言设计难题：新手完整指南

如何用Poppins字体解决多语言设计难题：新手完整指南【免费下载链接】Poppins Poppins, a Devanagari Latin family for Google Fonts. 项目地址: https://gitcode.com/gh_mirrors/po/Poppins 你是否曾为多语言项目中的字体选择而烦恼？当你的网站…...

2026/6/2 4:48:10 阅读更多 →