随笔分类 - 02-机器学习
摘要:import scipy.io as scio data = scio.loadmat('1.mat') test_data = data['yeast_f1_test_feature'] test_label = data['yeast_f1_test_label'] train_data = d
阅读全文
posted @ 2020-01-07 10:51
地球之眼
摘要:参考博客:https://blog.csdn.net/qq_31342997/article/details/88078213 https://blog.csdn.net/u012969412/article/details/76636336 https://blog.csdn.net/maqunf
阅读全文
摘要:1、先验概率:根据以往经验分析得到的概率 2、后验概率:基于新的信息,修正先验概率后获得的更接近实际情况的概率估计 3、最大似然估计:寻找能够以较高概率产生观察数据的系统参数 4、目标函数:用设计变量来表示所追求的目标形式(最优化经验风险和结构风险) 5、代价函数:整个训练集上所有样本误差的平均 6
阅读全文
摘要:1、导入数据可视化的相关库文件 2、读入数据 3、区分开类别特征和连续特征 理解:类别变量就是说特征取值比较少的变量,连续特征值就是说特征连续取值,所有用可视化数据的nunique() 上图中前四个表示连续特征,后边的都是类别特征,最后两个是标签。 4、可视化特征取值与类别的关系 理解:这样步骤可以
阅读全文
posted @ 2019-09-06 19:57
地球之眼
摘要:1.accuracy_score (取值在0-1之间,值越大越好) 理解:分类准确率分数是指所有分类正确的百分比。分类准确率这一衡量分类器的标准比较容易理解,但是它不能告诉你响应值的潜在分布,并且它也不能告诉你分类器犯错的类型。 sklearn形式:sklearn.metrics.accuracy_
阅读全文
posted @ 2019-09-03 20:20
地球之眼

浙公网安备 33010602011771号