2025/1/26
机器学习是人工智能的一个重要分支,它使计算机能够从数据中学习并做出预测。Scikit-learn是Python中最流行的机器学习库之一,提供了简单而高效的工具用于数据挖掘和数据分析。
监督学习:包括分类和回归。
无监督学习:包括聚类和降维。
模型评估:使用准确率、召回率等指标评估模型性能。
示例代码:
from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score, classification_report # 加载数据集 iris = load_iris() X, y = iris.data, iris.target # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # 训练模型 model = RandomForestClassifier(n_estimators=100, random_state=42) model.fit(X_train, y_train) # 预测与评估 y_pred = model.predict(X_test) print("Accuracy:", accuracy_score(y_test, y_pred)) print("Classification Report:\n", classification_report(y_test, y_pred))
运行步骤:
安装Scikit-learn库(如果尚未安装):
pip install scikit-learn
创建一个Python文件,例如ml_intro.py。
将上述代码粘贴到文件中。
在终端中运行:
python ml_intro.py
观察输出结果,包括模型的准确率和分类报告。
Scikit-learn是Python中用于机器学习的强大库。通过它可以轻松实现数据预处理、模型训练和评估。通过简单的API,即使是初学者也能快速上手机器学习。

浙公网安备 33010602011771号