pip install scikit-learnsklearn 用来做机器学习预测 / 分类 / 聚类的工具箱对于机器学习来说最常用的算法工具包是 scikit-learn简称 sklearn它是使用最广泛的开源 Python 机器学习库堪称机器学习神器。sklearn 提供了大量用于数据挖掘的机器学习工具覆盖数据预处理、可视化、交叉验证和多种机器学习算法。一、二、feature_selection模块1、SelectKBest特征选择2、StandardScaler 和 MinMaxScaler特征缩放3、KFold和cross_val_score交叉验证在交叉验证中训练集和验证集的拆分可以通过 sklearn.model_selection 中的 KFold 函数实现。在这个函数中有三个主要参数需要我们了解一下4、GridSearchCV调参1、分类Classification比如判断邮件是不是垃圾邮件判断用户会不会流失from sklearn.linear_model import LogisticRegression2、 回归Regression比如预测房价预测销量from sklearn.linear_model import LinearRegression3、聚类Clustering比如用户分群客户画像from sklearn.cluster import KMeans4、数据预处理比如标准化缺失值处理from sklearn.preprocessing import StandardScaler5、模型评估比如准确率混淆矩阵from sklearn.metrics import accuracy_score