用PythonTOPSIS算法5分钟搞定多指标决策分析每次面对一堆Excel表格需要从十几个维度评估供应商、产品方案或投资项目时你是否也经历过这样的痛苦手动计算权重、标准化数据、反复核对公式...往往花了大半天时间最后还发现某个单元格引用错误。更糟的是当下个月数据更新时又得重新折腾一遍。今天我要分享的TOPSIS算法配合Python自动化流程能让你彻底告别这种低效循环。TOPSISTechnique for Order Preference by Similarity to Ideal Solution是一种经典的多准则决策方法它的聪明之处在于通过计算每个方案与理想最优解和最劣解的相对距离来进行排序。不同于简单加权平均它能同时考虑各指标的量纲差异和方向性在投资评估、供应商选择、人才选拔等场景中表现尤为出色。下面我们就用Python的Pandas和Numpy库一步步实现这个算法的完整流程。1. 环境准备与数据加载首先确保你的Python环境已安装以下库通过pip install命令安装import pandas as pd import numpy as np from sklearn.preprocessing import MinMaxScaler假设我们有一个包含5家供应商评估数据的CSV文件指标包含价格越低越好、交货准时率越高越好、质量合格率越高越好和售后服务评分越高越好。用Pandas加载数据data pd.read_csv(supplier_evaluation.csv, index_col供应商ID) print(data.head(3))示例数据可能如下所示供应商ID价格(万元)交货准时率(%)质量合格率(%)售后服务评分S0015892954.2S0026288974.5S0036595934.12. 数据预处理与指标正向化TOPSIS要求所有指标都是越大越好类型。我们需要先将价格这类成本型指标转化为效益型指标# 成本型指标处理价格 data[价格评分] 1 / data[价格(万元)]对于已经符合越大越好特性的指标保持原值即可。然后构建决策矩阵decision_matrix data[[价格评分, 交货准时率(%), 质量合格率(%), 售后服务评分]].values3. 数据标准化处理不同指标的量纲和数量级差异会影响结果需要进行标准化。这里采用向量归一化方法# 向量归一化 norm_matrix decision_matrix / np.sqrt(np.sum(decision_matrix**2, axis0))4. 确定权重与加权标准化矩阵如果各指标重要性不同可以设置权重。这里假设权重为[0.3, 0.2, 0.3, 0.2]weights np.array([0.3, 0.2, 0.3, 0.2]) weighted_matrix norm_matrix * weights5. 计算理想解与负理想解# 理想最优解各指标最大值 ideal_best np.max(weighted_matrix, axis0) # 理想最劣解各指标最小值 ideal_worst np.min(weighted_matrix, axis0)6. 计算距离与相对接近度# 计算各方案到理想解的距离 dist_best np.sqrt(np.sum((weighted_matrix - ideal_best)**2, axis1)) dist_worst np.sqrt(np.sum((weighted_matrix - ideal_worst)**2, axis1)) # 计算相对接近度 closeness dist_worst / (dist_best dist_worst)7. 结果排序与输出将计算结果添加到原始数据中并排序data[TOPSIS评分] closeness data[排名] data[TOPSIS评分].rank(ascendingFalse) result data.sort_values(排名) print(result[[价格(万元), 交货准时率(%), 质量合格率(%), 售后服务评分, TOPSIS评分, 排名]])最终输出示例供应商ID价格(万元)交货准时率(%)质量合格率(%)售后服务评分TOPSIS评分排名S0026288974.50.6121S0015892954.20.5872S0036595934.10.55338. 完整代码封装与复用将上述流程封装成函数方便重复使用def topsis_analysis(data, cost_columns, weights): TOPSIS多准则决策分析 参数 data: DataFrame, 包含所有原始数据 cost_columns: list, 成本型指标列名值越小越好 weights: array, 各指标权重 返回 包含TOPSIS评分和排名的DataFrame # 正向化处理 df data.copy() for col in cost_columns: df[col_正向化] 1 / df[col] # 构建决策矩阵省略正向化列名处理细节 decision_matrix df[[...]].values # 选择所有处理后的指标列 # 标准化处理 norm_matrix decision_matrix / np.sqrt(np.sum(decision_matrix**2, axis0)) # 加权标准化 weighted_matrix norm_matrix * weights # 计算理想解 ideal_best np.max(weighted_matrix, axis0) ideal_worst np.min(weighted_matrix, axis0) # 计算距离 dist_best np.sqrt(np.sum((weighted_matrix - ideal_best)**2, axis1)) dist_worst np.sqrt(np.sum((weighted_matrix - ideal_worst)**2, axis1)) # 计算接近度 df[TOPSIS评分] dist_worst / (dist_best dist_worst) df[排名] df[TOPSIS评分].rank(ascendingFalse) return df.sort_values(排名)9. 实际应用中的注意事项指标选择确保所选指标具有代表性和独立性避免高度相关指标同时出现权重确定可以采用层次分析法AHP或熵权法确定更科学的权重数据质量注意处理缺失值和异常值必要时进行数据清洗结果验证首次应用时建议与人工评估结果交叉验证提示对于需要频繁更新的评估可以将此脚本与自动化数据管道结合实现评估结果定时自动生成。在我的实际项目中这套方法将原本需要半天的手工评估缩短到5分钟以内特别是在处理20供应商、每月更新的场景下效率提升更为明显。一个实用的技巧是将最终结果导出为Excel时用条件格式自动高亮排名前10%的方案这样决策者能快速聚焦最优选项。