博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

Sklearn的datasets数据库及model功能的运用

Posted on 2018-04-09 13:39  风吹白杨的安妮  阅读(1163)  评论(0)    收藏  举报
from sklearn import datasets
from sklearn.linear_model import LinearRegression
#来导入sklearn提供的波士顿房价的数据
loaded_data = datasets.load_boston()
X_data = loaded_data.data
y_data = loaded_data.target
model = LinearRegression()  #模型用线性回归哟
model.fit(X_data,y_data)

#先显示前面4个
print(model.predict(X_data[:4,:]))
print(y_data[:4])

Sklearn还允许我们自己创造一些数据

X,y = datasets.make_regression(n_samples=100,n_features=1,n_targets=1,noise=1)
#有100个样本,特征一个,目标变量一个,来玩画图
import matplotlib.pyplot as plt
#画X,y的散点图咯
plt.scatter(X,y)
plt.show()

#把noise变大点,会更加离散,例如noise=10
X,y = datasets.make_regression(n_samples=100,n_features=1,n_targets=1,noise=10)
plt.scatter(X,y)
plt.show()

#我们可以查看该线性回归方程的参数
print(model.coef_)
print(model.intercept_)

#显示对model定义的参数
print(model.get_params())

#对mdel学到的东西进行一个评分,X_data是用来预测的,y_data是用来比较的
print(model.score(X_data,y_data))
#74%的数据是吻合的