保姆级教程：用Python和SVM从零搭建一个纸币面额识别模型（附完整代码）

张

张建站

2026/6/3 1:41:55

10分钟阅读

从零构建纸币识别系统基于颜色矩与SVM的实战指南在自动售货机、ATM和智能收银系统中纸币识别技术扮演着关键角色。传统的光学字符识别(OCR)方法在面对不同版本、磨损程度的纸币时往往表现不稳定。本文将展示如何利用Python构建一个基于颜色特征的纸币面额识别系统这种方法对纸币的磨损、折叠具有更好的鲁棒性。1. 项目准备与环境搭建1.1 为什么选择颜色矩作为特征颜色矩是一种简单有效的图像特征表示方法特别适合我们的纸币识别场景原因有三计算效率高相比深度学习模型颜色矩计算量极小物理意义明确一阶矩(均值)反映整体色调二阶矩(方差)体现颜色变化幅度三阶矩(偏度)描述颜色分布不对称性对尺寸变化不敏感只要保持宽高比缩放图像不会显著改变颜色矩实际测试表明对于人民币这类不同面额有明显主色调差异的纸币颜色矩特征能达到90%以上的识别准确率1.2 开发环境配置推荐使用Python 3.8环境主要依赖库如下pip install pillow numpy scikit-learn matplotlib opencv-python关键库的作用Pillow (PIL)图像读取与基础处理NumPy数值计算与数组操作scikit-learnSVM分类器实现Matplotlib结果可视化OpenCV备选图像处理方案2. 数据准备与预处理2.1 数据集结构分析我们的数据集包含6种面额的人民币图像每种面额40张(正反面各20张)总计240张图像。图像命名规范为面额_序号.png例如1_1.png # 1元纸币第一张 100_40.png # 100元纸币最后一张2.2 图像预处理关键技术纸币图像预处理的核心挑战是图像尺寸不一致拍摄角度差异光照条件变化我们采用中心区域截取法解决这些问题from PIL import Image import numpy as np def preprocess_image(image_path, crop_size200): img Image.open(image_path) width, height img.size # 计算中心区域坐标 left (width - crop_size)/2 top (height - crop_size)/2 right (width crop_size)/2 bottom (height crop_size)/2 # 截取中心区域并缩放到统一尺寸 img_cropped img.crop((left, top, right, bottom)) img_resized img_cropped.resize((100, 100)) return img_resized这种方法有效消除了边缘干扰和尺寸差异同时保留了纸币的主要颜色特征。3. 特征工程颜色矩计算3.1 颜色矩的数学原理对于每个颜色通道(C∈{R,G,B})我们计算三个矩特征一阶矩(均值) $$ \mu_C \frac{1}{N}\sum_{i1}^N p_{C,i} $$二阶矩(标准差) $$ \sigma_C \sqrt{\frac{1}{N}\sum_{i1}^N (p_{C,i} - \mu_C)^2} $$三阶矩(偏度) $$ s_C \left( \frac{1}{N}\sum_{i1}^N |p_{C,i} - \mu_C|^3 \right)^{1/3} $$3.2 Python实现代码def calculate_color_moments(image): # 将图像转换为NumPy数组 img_array np.array(image) # 分离RGB通道 R img_array[:,:,0].flatten() / 255.0 G img_array[:,:,1].flatten() / 255.0 B img_array[:,:,2].flatten() / 255.0 # 计算各通道颜色矩 features [] for channel in [R, G, B]: mean np.mean(channel) std np.std(channel) skewness np.mean(np.abs(channel - mean)**3)**(1/3) features.extend([mean, std, skewness]) return np.array(features)4. 模型构建与评估4.1 SVM分类器原理支持向量机(SVM)通过寻找最优超平面来最大化不同类别之间的间隔。对于我们的多分类问题scikit-learn自动采用一对多策略为每个面额训练一个二分类器最终选择置信度最高的类别作为预测结果4.2 完整建模流程from sklearn.svm import SVC from sklearn.model_selection import train_test_split from sklearn.metrics import classification_report def train_model(image_dir): image_files [f for f in os.listdir(image_dir) if f.endswith(.png)] X np.zeros((len(image_files), 9)) # 9个特征 y np.zeros(len(image_files)) # 标签 for i, filename in enumerate(image_files): # 预处理图像 img_path os.path.join(image_dir, filename) img preprocess_image(img_path) # 提取特征 X[i] calculate_color_moments(img) # 从文件名提取面额标签 y[i] int(filename.split(_)[0]) # 划分训练测试集 X_train, X_test, y_train, y_test train_test_split( X, y, test_size0.2, random_state42) # 训练SVM模型 model SVC(kernellinear, decision_function_shapeovr) model.fit(X_train, y_train) # 评估模型 y_pred model.predict(X_test) print(classification_report(y_test, y_pred)) return model4.3 模型性能优化技巧核函数选择线性核适合特征维度不高的情况RBF核能捕捉更复杂的特征关系类别权重调整model SVC(class_weightbalanced) # 自动调整类别权重特征标准化from sklearn.preprocessing import StandardScaler scaler StandardScaler() X_train scaler.fit_transform(X_train) X_test scaler.transform(X_test)5. 结果可视化与实战应用5.1 特征空间可视化使用PCA将9维特征降维到2维进行可视化from sklearn.decomposition import PCA import matplotlib.pyplot as plt def visualize_features(X, y): pca PCA(n_components2) X_pca pca.fit_transform(X) plt.figure(figsize(10, 8)) for denomination in np.unique(y): mask y denomination plt.scatter(X_pca[mask, 0], X_pca[mask, 1], labelf{int(denomination)}元) plt.xlabel(PCA Component 1) plt.ylabel(PCA Component 2) plt.title(纸币颜色特征分布) plt.legend() plt.show()5.2 实际部署建议性能优化将训练好的模型保存为joblib文件使用OpenCV替代PIL提升图像处理速度错误处理机制def predict_denomination(model, image_path): try: img preprocess_image(image_path) features calculate_color_moments(img) return model.predict([features])[0] except Exception as e: print(f预测失败: {str(e)}) return None持续学习收集错误分类样本进行模型迭代定期用新数据重新训练模型6. 项目扩展与进阶方向6.1 多特征融合策略结合颜色矩与其他特征提升准确率纹理特征使用LBP(局部二值模式)提取纸币纹理计算灰度共生矩阵(GLCM)特征结构特征检测纸币边缘和关键区域定位面额数字位置6.2 深度学习替代方案对于更复杂的识别场景可以考虑CNN模型from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense model Sequential([ Conv2D(32, (3,3), activationrelu, input_shape(100,100,3)), MaxPooling2D((2,2)), Conv2D(64, (3,3), activationrelu), MaxPooling2D((2,2)), Flatten(), Dense(128, activationrelu), Dense(6, activationsoftmax) ])迁移学习使用预训练的ResNet、MobileNet等模型针对纸币数据进行微调6.3 实际部署中的挑战光照条件变化在预处理阶段加入直方图均衡化使用颜色校正算法纸币磨损处理增加数据增强模拟磨损效果采用更鲁棒的特征提取方法多国货币支持扩展数据集包含不同国家纸币设计多标签分类系统

分析 Redis AOF 覆写期间后台子进程对前台高频 Redis单线程高性能底层Reactor模型写入导致的延迟毛刺隐患

分析 Redis AOF 覆写期间后台子进程对前台高频 Redis单线程高性能底层Reactor模型写入导致的延迟毛刺隐患一、概述 1.a 分析 Redis AOF 覆写期间后台子进程定义分析 Redis AOF 覆写期间后台子进程是现代系统架构中不可或缺的关键环节，它直接影响系统的吞吐能力、响…...

2026/6/3 1:40:51 阅读更多 →

别再只盯着MSE了！用Python实战房价预测，带你搞懂线性回归的4大评估指标（附完整代码）

线性回归模型评估：超越MSE的房价预测实战指南在数据科学项目中，构建模型只是第一步，真正考验功力的是如何科学评估模型表现。很多初学者在完成房价预测模型后，面对各种评估指标往往一头雾水——MSE值多大算好？为什么R…...

2026/6/3 1:39:50 阅读更多 →

PDF补丁丁完整指南：专业级PDF批量处理与文档结构深度解析

PDF补丁丁完整指南：专业级PDF批量处理与文档结构深度解析【免费下载链接】PDFPatcher PDF补丁丁——PDF工具箱，可以编辑书签、剪裁旋转页面、解除限制、提取或合并文档，探查文档结构，提取图片、转成图片等等项目地址: https:/…...

2026/6/3 1:38:49 阅读更多 →

量子误差缓解技术：原理、应用与优化

1. 量子误差缓解技术概述量子计算在NISQ（含噪中等规模量子）时代面临的核心挑战之一是量子噪声对计算结果的干扰。误差缓解技术作为当前最实用的解决方案，能够在硬件层面纠错技术成熟前，显著提升量子算法的执行精度。与传统纠错不同…...

2026/6/2 9:54:07 阅读更多 →

从新手到专家：Ryzen SDT调试工具完整指南，轻松解锁AMD处理器隐藏性能

从新手到专家：Ryzen SDT调试工具完整指南，轻松解锁AMD处理器隐藏性能【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Tabl…...

2026/6/2 11:40:26 阅读更多 →

如何用Poppins字体解决多语言设计难题：新手完整指南

如何用Poppins字体解决多语言设计难题：新手完整指南【免费下载链接】Poppins Poppins, a Devanagari Latin family for Google Fonts. 项目地址: https://gitcode.com/gh_mirrors/po/Poppins 你是否曾为多语言项目中的字体选择而烦恼？当你的网站…...

2026/6/2 4:48:10 阅读更多 →