数学符号: 从陌生到驾驭 (min 与 argmin 的实战解码)

张

张建站

2026/5/27 14:22:54

10分钟阅读

1. 初识min与argmin从买菜到机器学习第一次看到min和argmin这两个符号时我正盯着菜市场的价格牌发呆。左边摊位写着今日特价min{5,4,6}4元/斤右边摊位则是最低价位置argmin{5,4,6}第2个。这不就是数学符号的活教材吗min就像是个精明的比价工具在一堆数字中精准找出最小的那个。比如min{3,1,9,8}它会毫不犹豫地告诉你结果是1。而argmin则更像个侦探不仅要找出最小值还要定位这个值的位置——在前面的例子里它会指出1出现在集合的第2个位置假设从1开始计数。在机器学习领域这两个符号简直是无处不在。举个最简单的例子假设我们要预测明天的气温历史数据是[15,18,16,20]摄氏度。用min就是找出最低温15度而argmin则告诉我们这个最低温出现在第1天Python从0开始的话就是第0天。import numpy as np temps np.array([15, 18, 16, 20]) print(f最低温度{np.min(temps)}) # 输出15 print(f最低温度日期索引{np.argmin(temps)}) # 输出02. min的七十二变从集合到函数2.1 基础用法集合中的最小值min最基础的用法就是从有限集合中找最小值。比如在电商价格排序时prices [299, 199, 249, 179] cheapest min(prices) # 返回179但实际工程中更常见的是处理缺失值。比如我们有用户评分数据[5, None, 3, 4]想找最低有效评分ratings [r for r in [5, None, 3, 4] if r is not None] min_rating min(ratings) if ratings else None2.2 进阶应用函数的最小值在机器学习中min经常与函数配合使用。比如我们要优化一个二次函数f(x)x²3x4在区间[-5,5]的最小值def f(x): return x**2 3*x 4 x_values np.linspace(-5, 5, 1000) y_values f(x_values) min_value np.min(y_values) # 最小值约为1.75这里有个实用技巧当函数比较复杂时可以先用网格搜索找大致范围再用更精确的优化算法。2.3 矩阵中的最小值处理矩阵时min可以沿着特定轴计算。比如一个用户-商品评分矩阵ratings np.array([ [5, 3, 0, 1], [4, 0, 2, 5], [1, 1, 4, 2] ]) # 每行的最低分每个用户的最低评分 row_mins np.min(ratings, axis1) # [0, 0, 1] # 每列的最低分每个商品的最低评分 col_mins np.min(ratings, axis0) # [1, 0, 0, 1]3. argmin的实战艺术不仅知道多少还要知道在哪3.1 基础定位找出最小值的位置argmin的强大之处在于它能告诉我们最小值的确切位置。继续用之前的温度预测例子forecasts np.array([15.2, 16.8, 14.9, 18.3]) coldest_day np.argmin(forecasts) # 返回2第3天在推荐系统中这个功能特别有用。比如我们要给用户推荐最便宜的商品product_prices np.array([299, 599, 199, 399]) cheapest_index np.argmin(product_prices) # 返回23.2 多维数据的argmin当处理矩阵时argmin能返回多维索引。比如在图像处理中找最暗像素image np.random.randint(0, 256, size(100, 100)) darkest_pixel np.unravel_index(np.argmin(image), image.shape) # 返回类似(23, 45)的坐标在自然语言处理中可以用argmin找到文档中最短的句子sentences [这是一个句子, 短, 这个句子稍微长一些] shortest_idx np.argmin([len(s) for s in sentences]) # 返回13.3 函数优化中的argminargmin在机器学习模型训练中扮演着核心角色。以线性回归为例我们要找到使损失函数最小的参数wdef loss(w): return np.sum((y - X w)**2) # 在参数空间采样 w_candidates np.linspace(-5, 5, 1000) loss_values [loss(np.array([w])) for w in w_candidates] best_w w_candidates[np.argmin(loss_values)]实际项目中我们不会用这种暴力搜索而是用梯度下降但原理相同——都是在找使损失函数最小的参数。4. 机器学习中的min与argmin实战4.1 损失函数最小化在训练神经网络时我们实际上是在解决这样一个优化问题θ* argmin L(θ)其中L是损失函数θ是模型参数。用PyTorch实现看起来像这样import torch import torch.nn as nn model nn.Linear(10, 1) criterion nn.MSELoss() optimizer torch.optim.SGD(model.parameters(), lr0.01) for epoch in range(100): optimizer.zero_grad() outputs model(inputs) loss criterion(outputs, targets) loss.backward() optimizer.step() # 这步就是在逼近argmin4.2 推荐系统中的协同过滤在矩阵分解推荐算法中我们要最小化min ∑(r_ui - p_u·q_i)² λ(||p_u||² ||q_i||²)这里min表示我们要找使这个表达式最小的p和q的值。用代码表示def matrix_factorization(R, k, steps5000, alpha0.0002, beta0.02): # R是评分矩阵 P np.random.rand(R.shape[0], k) Q np.random.rand(R.shape[1], k) for step in range(steps): for i in range(R.shape[0]): for j in range(R.shape[1]): if R[i][j] 0: eij R[i][j] - np.dot(P[i,:],Q[j,:].T) # 梯度下降更新 P[i] alpha * (2 * eij * Q[j] - beta * P[i]) Q[j] alpha * (2 * eij * P[i] - beta * Q[j]) return P, Q4.3 聚类算法的中心点选择K-means算法本质上是解决argmin ∑∑ ||x - μ_i||²其中μ_i是第i个簇的中心。算法步骤中的分配阶段就是在找argmindef kmeans(X, k, max_iters100): centroids X[np.random.choice(len(X), k, replaceFalse)] for _ in range(max_iters): # 分配步骤为每个点找最近的质心 distances np.sqrt(((X - centroids[:, np.newaxis])**2).sum(axis2)) closest np.argmin(distances, axis0) # 更新步骤重新计算质心 new_centroids np.array([X[closesti].mean(axis0) for i in range(k)]) if np.all(centroids new_centroids): break centroids new_centroids return centroids, closest5. 避坑指南min和argmin的常见误区5.1 空集合处理新手常犯的错误是忘记处理空集合情况# 危险代码 empty_list [] min_value min(empty_list) # ValueError! # 安全写法 min_value min(empty_list, default0) # 返回0在pandas中处理缺失值时也要小心import pandas as pd df pd.DataFrame({A: [1, 2, None]}) min_val df[A].min() # 返回1因为pandas默认跳过NaN5.2 多维度argmin的误解当处理多维数组时argmin返回的是展平后的索引arr np.array([[3, 2, 9], [7, 6, 1]]) flat_idx np.argmin(arr) # 返回5从0开始计数 row, col np.unravel_index(flat_idx, arr.shape) # (1, 2)5.3 浮点数精度问题在优化问题中浮点数比较可能导致意外结果a 0.1 0.1 0.1 b 0.3 print(a b) # False print(min(a, b)) # 可能得到意想不到的结果 # 安全比较 def safe_min(x, y, tol1e-10): return x if abs(x-y) tol and x y else y5.4 自定义对象的min处理自定义对象时需要定义比较方法class Product: def __init__(self, name, price): self.name name self.price price def __lt__(self, other): return self.price other.price products [Product(A, 100), Product(B, 80)] cheapest min(products) # 返回Product B6. 性能优化大规模数据下的min/argmin6.1 分块处理策略当数据太大无法放入内存时可以采用分块处理def chunked_min(filename, chunk_size1000000): min_val float(inf) with open(filename) as f: while True: chunk [float(line) for line in itertools.islice(f, chunk_size)] if not chunk: break min_val min(min_val, min(chunk)) return min_val6.2 并行计算加速对于多核CPU可以使用并行计算from multiprocessing import Pool def parallel_min(data, n_processes4): chunk_size len(data) // n_processes chunks [data[i:ichunk_size] for i in range(0, len(data), chunk_size)] with Pool(n_processes) as p: return min(p.map(min, chunks))6.3 GPU加速对于超大规模数据可以使用GPU加速import cupy as cp def gpu_min(arr): gpu_arr cp.asarray(arr) return cp.min(gpu_arr).get()7. 数学背后的直觉为什么这两个符号如此重要min和argmin之所以在机器学习中无处不在是因为它们完美对应了建模的两个核心问题评估问题模型的表现有多好min给出误差的下限决策问题哪个模型/参数最好argmin给出最优选择在贝叶斯统计中最大后验估计(MAP)可以表示为θ_MAP argmax p(θ|D) argmin [-log p(θ|D)]在支持向量机中优化目标是最小化min (1/2)||w||² C∑ξ_i在深度学习模型剪枝时我们会解决min |θ|₀ s.t. 准确率损失 ε这些例子都展示了min/argmin如何成为连接数学理论与工程实践的桥梁。理解它们的本质就能看透很多算法背后的设计思想。

SingleFile：一键保存完整网页的终极解决方案，彻底告别碎片化保存烦恼

SingleFile：一键保存完整网页的终极解决方案，彻底告别碎片化保存烦恼【免费下载链接】SingleFile Web Extension for saving a faithful copy of a complete web page in a single HTML file 项目地址: https://gitcode.com/gh_mirrors/si/SingleFile…...

2026/5/27 14:20:12 阅读更多 →

$清华大学thuthesis LaTeX模板：在Overleaf上快速完成学位论文的终极指南$

清华大学thuthesis LaTeX模板：在Overleaf上快速完成学位论文的终极指南

清华大学thuthesis LaTeX模板：在Overleaf上快速完成学位论文的终极指南【免费下载链接】thuthesis LaTeX Thesis Template for Tsinghua University 项目地址: https://gitcode.com/gh_mirrors/th/thuthesis 你是否正在为清华大学学位论文的格式要求而烦恼&…...

2026/5/27 14:20:06 阅读更多 →

Boss-Key：Windows办公隐私保护终极指南，一键隐藏窗口告别尴尬时刻

Boss-Key：Windows办公隐私保护终极指南，一键隐藏窗口告别尴尬时刻【免费下载链接】Boss-Key 老板来了？快用Boss-Key老板键一键隐藏静音当前窗口！上班摸鱼必备神器项目地址: https://gitcode.com/gh_mirrors/bo/Boss-Key …...

2026/5/27 14:19:00 阅读更多 →

Oracle EBS R12 主 / 辅助分类帐（主 / 辅助帐套）

Oracle EBS R12 主 / 辅助分类帐（主 / 辅助帐套）落地全套文档包含：配置清单、科目映射规则模板、4 类典型调整分录、税会 / IFRS 案例分录，可直接用于实施、方案文档、上线配置。说明：R11 帐套 (SOB)、R12 分类帐 (Led…...

2026/5/26 9:09:40 阅读更多 →

Harness的配置漂移检测与自动修复

云原生时代的稳定性利器：Harness配置漂移检测与自动修复全指南引言痛点引入相信每一位DevOps工程师、SRE或者运维负责人都遇到过这样的噩梦： 测试环境验证了3天的功能，上线到生产10分钟就出现503错误，排查了2小时才发现&…...

2026/5/27 10:33:57 阅读更多 →

【工程实践】代码质量与测试策略：构建可靠的软件交付体系

【工程实践】代码质量与测试策略：构建可靠的软件交付体系引言代码质量是软件项目成功的关键因素之一。良好的代码质量不仅能提高开发效率，还能降低维护成本，提升系统的可靠性。本文将详细介绍代码质量保障和测试策略的最佳实践。一、代码质…...

2026/5/27 10:34:01 阅读更多 →

3分钟快速上手OBS多平台同步直播插件：告别重复配置，一键推流到多个平台

3分钟快速上手OBS多平台同步直播插件：告别重复配置，一键推流到多个平台【免费下载链接】obs-multi-rtmp OBS複数サイト同時配信プラグイン项目地址: https://gitcode.com/gh_mirrors/ob/obs-multi-rtmp 你是否曾经为在不同直播平台同步推流而烦…...

2026/5/27 10:34:01 阅读更多 →