Sklearn的datasets数据库及model功能的运用

Posted on 2018-04-09 13:39 风吹白杨的安妮阅读(1173) 评论(0) 收藏举报

from sklearn import datasets
from sklearn.linear_model import LinearRegression
#来导入sklearn提供的波士顿房价的数据
loaded_data = datasets.load_boston()
X_data = loaded_data.data
y_data = loaded_data.target
model = LinearRegression()  #模型用线性回归哟
model.fit(X_data,y_data)

#先显示前面4个
print(model.predict(X_data[:4,:]))
print(y_data[:4])

Sklearn还允许我们自己创造一些数据

X,y = datasets.make_regression(n_samples=100,n_features=1,n_targets=1,noise=1)
#有100个样本，特征一个，目标变量一个，来玩画图

import matplotlib.pyplot as plt
#画X，y的散点图咯
plt.scatter(X,y)
plt.show()

#把noise变大点，会更加离散，例如noise=10
X,y = datasets.make_regression(n_samples=100,n_features=1,n_targets=1,noise=10)
plt.scatter(X,y)
plt.show()

#我们可以查看该线性回归方程的参数
print(model.coef_)
print(model.intercept_)

#显示对model定义的参数
print(model.get_params())

#对mdel学到的东西进行一个评分,X_data是用来预测的，y_data是用来比较的
print(model.score(X_data,y_data))
#74%的数据是吻合的

刷新页面返回顶部

风吹白杨的安妮

公告

Sklearn的datasets数据库及model功能的运用