07 2018 档案
摘要:一. 数据集的准备与预处理 1 . 收集dataset (大量用户名--包含正常用户名与非法用户名) 包含两个txt文件 legal_name.txt ilegal_name.txt. 如下图所示 2. 用文件进行预处理 根据需求提取相应的特征, 输出成 csv 格式,包含特征列与label列 把合
阅读全文
摘要:一. What’s machine learningMachine Learning is the science of gettingcomputers to act without being explicitly programmed --- Andrew...
阅读全文
摘要:一 交叉验证交叉验证的目的在实际训练中,模型通常对训练数据好,但是对训练数据之外的数据拟合程度差。用于评价模型的泛化能力,从而进行模型选择。交叉验证的基本思想把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(train set),另一部分做为验证集...
阅读全文
摘要:一. 数据集的准备与预处理1 . 收集dataset (大量用户名--包含正常用户名与非法用户名)包含两个txt文件 legal_name.txt ilegal_name.txt. 如下图所示2. 用文件进行预处理# Data setsimport osimpo...
阅读全文
摘要:Naive Bayes-朴素贝叶斯Bayes’ theorem(贝叶斯法则)在概率论和统计学中,Bayes’ theorem(贝叶斯法则)根据事件的先验知识描述事件的概率。贝叶斯法则表达式如下所示P(A|B) – 在事件B下事件A发生的条件概率P(B|A) – 在事件...
阅读全文

浙公网安备 33010602011771号