随笔分类 -  02-机器学习

摘要:import scipy.io as scio data = scio.loadmat('1.mat') test_data = data['yeast_f1_test_feature'] test_label = data['yeast_f1_test_label'] train_data = d 阅读全文
posted @ 2020-01-07 10:51 地球之眼
摘要:参考博客:https://blog.csdn.net/qq_31342997/article/details/88078213 https://blog.csdn.net/u012969412/article/details/76636336 https://blog.csdn.net/maqunf 阅读全文
posted @ 2019-10-13 15:23 地球之眼 阅读(1065) 评论(0) 推荐(0)
摘要:1、先验概率:根据以往经验分析得到的概率 2、后验概率:基于新的信息,修正先验概率后获得的更接近实际情况的概率估计 3、最大似然估计:寻找能够以较高概率产生观察数据的系统参数 4、目标函数:用设计变量来表示所追求的目标形式(最优化经验风险和结构风险) 5、代价函数:整个训练集上所有样本误差的平均 6 阅读全文
posted @ 2019-09-09 15:48 地球之眼 阅读(408) 评论(0) 推荐(0)
摘要:1、导入数据可视化的相关库文件 2、读入数据 3、区分开类别特征和连续特征 理解:类别变量就是说特征取值比较少的变量,连续特征值就是说特征连续取值,所有用可视化数据的nunique() 上图中前四个表示连续特征,后边的都是类别特征,最后两个是标签。 4、可视化特征取值与类别的关系 理解:这样步骤可以 阅读全文
posted @ 2019-09-06 19:57 地球之眼
摘要:1.accuracy_score (取值在0-1之间,值越大越好) 理解:分类准确率分数是指所有分类正确的百分比。分类准确率这一衡量分类器的标准比较容易理解,但是它不能告诉你响应值的潜在分布,并且它也不能告诉你分类器犯错的类型。 sklearn形式:sklearn.metrics.accuracy_ 阅读全文
posted @ 2019-09-03 20:20 地球之眼