2025/1/26

机器学习是人工智能的一个重要分支,它使计算机能够从数据中学习并做出预测。Scikit-learn是Python中最流行的机器学习库之一,提供了简单而高效的工具用于数据挖掘和数据分析。
监督学习:包括分类和回归。
无监督学习:包括聚类和降维。
模型评估:使用准确率、召回率等指标评估模型性能。
示例代码:

 

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report

# 加载数据集
iris = load_iris()
X, y = iris.data, iris.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 训练模型
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# 预测与评估
y_pred = model.predict(X_test)
print("Accuracy:", accuracy_score(y_test, y_pred))
print("Classification Report:\n", classification_report(y_test, y_pred))

 

运行步骤:
安装Scikit-learn库(如果尚未安装):

pip install scikit-learn
创建一个Python文件,例如ml_intro.py。
将上述代码粘贴到文件中。
在终端中运行:

python ml_intro.py
观察输出结果,包括模型的准确率和分类报告。


Scikit-learn是Python中用于机器学习的强大库。通过它可以轻松实现数据预处理、模型训练和评估。通过简单的API,即使是初学者也能快速上手机器学习。

posted @ 2025-01-26 22:11  伐木工熊大  阅读(17)  评论(0)    收藏  举报