07 2018 档案

摘要:一. 数据集的准备与预处理 1 . 收集dataset (大量用户名--包含正常用户名与非法用户名) 包含两个txt文件 legal_name.txt ilegal_name.txt. 如下图所示 2. 用文件进行预处理 根据需求提取相应的特征, 输出成 csv 格式,包含特征列与label列 把合 阅读全文
posted @ 2018-07-10 10:57 曾先森在努力 阅读(601) 评论(0) 推荐(0)
摘要:一. What’s machine learningMachine Learning is the science of gettingcomputers to act without being explicitly programmed --- Andrew... 阅读全文
posted @ 2018-07-09 10:55 曾先森在努力 阅读(759) 评论(0) 推荐(0)
摘要:一 交叉验证交叉验证的目的在实际训练中,模型通常对训练数据好,但是对训练数据之外的数据拟合程度差。用于评价模型的泛化能力,从而进行模型选择。交叉验证的基本思想把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(train set),另一部分做为验证集... 阅读全文
posted @ 2018-07-07 17:06 曾先森在努力 阅读(1249) 评论(0) 推荐(1)
摘要:一. 数据集的准备与预处理1 . 收集dataset (大量用户名--包含正常用户名与非法用户名)包含两个txt文件 legal_name.txt ilegal_name.txt. 如下图所示2. 用文件进行预处理# Data setsimport osimpo... 阅读全文
posted @ 2018-07-06 14:47 曾先森在努力 阅读(331) 评论(0) 推荐(0)
摘要:Naive Bayes-朴素贝叶斯Bayes’ theorem(贝叶斯法则)在概率论和统计学中,Bayes’ theorem(贝叶斯法则)根据事件的先验知识描述事件的概率。贝叶斯法则表达式如下所示P(A|B) – 在事件B下事件A发生的条件概率P(B|A) – 在事件... 阅读全文
posted @ 2018-07-04 16:17 曾先森在努力 阅读(2812) 评论(0) 推荐(0)