随笔分类 -  机器学习

机器学习分类算法常用评价指标
摘要:1. 准确率,召回率,精确率,F1-score,Fβ,ROC曲线,AUC值 为了评价模型以及在不同研究者之间进行性能比较,需要统一的评价标准。根据数据挖掘理论的一般方法,评价模型预测能力最广泛使用的是二维混淆矩阵(Confusion matrix)(如下表所示)。 二维混淆矩阵 真实类别 预测结果 阅读全文
posted @ 2018-10-16 19:21 asialee 阅读(2024) 评论(0) 推荐(0)
朴素贝叶斯算法——实现新闻分类(Sklearn实现)
摘要:1、朴素贝叶斯实现新闻分类的步骤 (1)提供文本文件,即数据集下载 (2)准备数据 将数据集划分为训练集和测试集;使用jieba模块进行分词,词频统计,停用词过滤,文本特征提取,将文本数据向量化 停用词文本stopwords_cn.txt下载 jieba模块学习:https://github.com 阅读全文
posted @ 2018-08-04 10:10 asialee 阅读(6821) 评论(0) 推荐(1)
KNN算法项目实战——改进约会网站的配对效果
摘要:KNN项目实战——改进约会网站的配对效果 1、项目背景: 海伦女士一直使用在线约会网站寻找适合自己的约会对象。尽管约会网站会推荐不同的人选,但她并不是喜欢每一个人。经过一番总结,她发现自己交往过的人可以进行如下分类: 不喜欢的人 魅力一般的人 极具魅力的人 2、项目数据 海伦收集约会数据已经有了一段 阅读全文
posted @ 2018-07-13 20:51 asialee 阅读(3324) 评论(1) 推荐(0)