2018年10月16日
摘要: 1. 准确率,召回率,精确率,F1-score,Fβ,ROC曲线,AUC值 为了评价模型以及在不同研究者之间进行性能比较,需要统一的评价标准。根据数据挖掘理论的一般方法,评价模型预测能力最广泛使用的是二维混淆矩阵(Confusion matrix)(如下表所示)。 二维混淆矩阵 真实类别 预测结果 阅读全文
posted @ 2018-10-16 19:21 asialee 阅读(1805) 评论(0) 推荐(0) 编辑
  2018年9月7日
摘要: 1、数据集准备 测试数据集下载:https://github.com/Asia-Lee/Vulnerability_classify/blob/master/testdata.xls 停用词过滤表下载:https://github.com/Asia-Lee/Vulnerability_classif 阅读全文
posted @ 2018-09-07 14:52 asialee 阅读(5367) 评论(0) 推荐(1) 编辑
  2018年8月4日
摘要: 1、朴素贝叶斯实现新闻分类的步骤 (1)提供文本文件,即数据集下载 (2)准备数据 将数据集划分为训练集和测试集;使用jieba模块进行分词,词频统计,停用词过滤,文本特征提取,将文本数据向量化 停用词文本stopwords_cn.txt下载 jieba模块学习:https://github.com 阅读全文
posted @ 2018-08-04 10:10 asialee 阅读(6486) 评论(0) 推荐(1) 编辑
  2018年7月13日
摘要: KNN项目实战——改进约会网站的配对效果 1、项目背景: 海伦女士一直使用在线约会网站寻找适合自己的约会对象。尽管约会网站会推荐不同的人选,但她并不是喜欢每一个人。经过一番总结,她发现自己交往过的人可以进行如下分类: 不喜欢的人 魅力一般的人 极具魅力的人 2、项目数据 海伦收集约会数据已经有了一段 阅读全文
posted @ 2018-07-13 20:51 asialee 阅读(3167) 评论(1) 推荐(0) 编辑
  2018年7月7日
摘要: 1、RNN(Recurrent Neural Network)循环神经网络模型 详见RNN循环神经网络:https://www.cnblogs.com/pinard/p/6509630.html 2、LSTM(Long Short Term Memory)长短期记忆神经网络模型 详见LSTM长短期记 阅读全文
posted @ 2018-07-07 14:19 asialee 阅读(1461) 评论(0) 推荐(0) 编辑
  2018年6月30日
摘要: CNN卷积神经网络处理Mnist数据集 CNN模型结构: 输入层:Mnist数据集(28*28) 第一层卷积:感受视野5*5,步长为1,卷积核:32个 第一层池化:池化视野2*2,步长为2 第二层卷积:感受视野5*5,步长为1,卷积核:64个 第二层池化:池化视野2*2,步长为2 全连接层:设置10 阅读全文
posted @ 2018-06-30 19:53 asialee 阅读(1397) 评论(0) 推荐(0) 编辑
  2018年6月29日
摘要: MNIST手写数字识别 MNIST数据集介绍和下载:http://yann.lecun.com/exdb/mnist/ 一、数据集介绍: MNIST是一个入门级的计算机视觉数据集 下载下来的数据集被分成两部分:60000行的训练数据集(mnist.train)和10000行的测试数据集(mnist. 阅读全文
posted @ 2018-06-29 20:44 asialee 阅读(2126) 评论(0) 推荐(0) 编辑
  2018年6月28日
摘要: 结果: 阅读全文
posted @ 2018-06-28 10:13 asialee 阅读(1484) 评论(0) 推荐(0) 编辑