14_转换器和估计器

1.转换器:

 fit_transform():输入数据直接转换。

 fit():输入数据,进行一些计算,算平均值、方差等,不进行数据的转换。

 transform():根据fit得出的平均值、方差,来处理新的数据。

 因此,如果fit_transform与fit的数据不一样,那么transform数据结果也不一样。

2.估计器(estimator):

 所谓的估计器就是一类实现了算法的API。

 注意:训练集分为特征值和目标值、测试集也分为特征值和目标值。

 x_train:训练集中的特征值;y_train:训练集中的目标值;x_test:测试集中的特征值;y_test:测试集中的目标值;

 (x_train(data)和y_train(target)的特征要一样,年龄特征预测也要对应年龄,不能把年龄特征值来预测性别,不是吗?)

 估计器的流程:数据划分为训练集和测试集,我们建立模型的时候只需要把训练集输入进去就可以。训练集包括x_train、y_train,调用fit传入x_train、y_train,这样此算法就能利用这个模型进行计算,模型建立好之后要预测数据,看模型预测的数据准确与否,输入测试集的数据x_test、y_test,调用predict(x_test),把测试集的特征值输入进去,来预测此测试集的目标值是什么(就像把特征值输入进去预测房价走向),每个算法应该都包括scroe这个方法,查看预测的准确性scroe(x_test,y_test),真实值是1类别,预测值是2类别,就视为不准确。预测的时候应该有预测的类别和真实的类别。

 

 

 

posted @ 2019-10-25 21:15  会飞的发如雪  阅读(246)  评论(0)    收藏  举报