随笔分类 -  机器学习

摘要:4.1 基于贝叶斯决策理论的分类方法 朴素贝叶斯 优点:在数据较少的情况下仍然有效,可以处理多类别问题 缺点:对于输入数据的准备方式较为敏感 适用数据类型:标称型数据 贝叶斯决策理论的核心思想:选择具有最高概率的决策。 4.2 条件概率 4.3 使用条件概率来分类 4.4 使用朴素贝叶斯进行文档分类 阅读全文
posted @ 2016-02-06 18:01 地表最强队队员 阅读(789) 评论(0) 推荐(0)
摘要:3.1 决策树的构造优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据.缺点:可能会产生过度匹配问题.适用数据类型:数值型和标称型.一般流程:1.收集数据2.准备数据3.分析数据4.训练算法5.测试算法6.使用算法3.1.1 信息增益创建数据集def createD... 阅读全文
posted @ 2015-12-06 19:40 地表最强队队员 阅读(553) 评论(0) 推荐(0)
摘要:knn算法:1.优点:精度高、对异常值不敏感、无数据输入假定2.缺点:计算复杂度高、空间复杂度高。3.适用数据范围:数值型和标称型。一般流程:1.收集数据2.准备数据3.分析数据4.训练算法:不适用5.测试算法:计算正确率6.使用算法:需要输入样本和结构化的输出结果,然后运行k-近邻算法判定输入数据... 阅读全文
posted @ 2015-12-05 14:40 地表最强队队员 阅读(424) 评论(0) 推荐(0)
摘要:http://sourceforge.net/projects/numpy/files/下载对应版本的numpy,到处下不到,找到一个没python2.7用pip吧,pip install numpy下载完毕,提示没装C++,意思是还要装VS2008,但装的是VS2012,只好去下载一个VC for... 阅读全文
posted @ 2015-12-04 19:45 地表最强队队员 阅读(382) 评论(0) 推荐(0)
摘要:为了培养一个机器学习领域专家那样的直觉,最好的办法就是,对你遇到的每一个机器学习问题,把所有的算法试个遍,直到有一天,你凭直觉就知道某些算法行不通. 阅读全文
posted @ 2015-11-14 19:15 地表最强队队员 阅读(182) 评论(0) 推荐(0)
摘要:library('ggplot2')df 0, 1, 0)mean(with(df, logit.predictions == Label))#正确率 0.5156,跟猜差不多一样的结果library('e1071')svm.fit0,1,0)mean(with(df,svm.prediction... 阅读全文
posted @ 2015-11-14 19:11 地表最强队队员 阅读(404) 评论(0) 推荐(0)
摘要:#数据集来源http://spamassassin.apache.org/publiccorpus/#加载数据library(tm)library(ggplot2)data.path,有些没有#参数是一封邮件向量,每一个元素就是邮件的一行get.from ]')[[1]]#忽略空元素 from ... 阅读全文
posted @ 2015-10-22 14:18 地表最强队队员 阅读(386) 评论(0) 推荐(0)
摘要:#定义函数,打开每一个文件,找到空行,将空行后的文本返回为一个字符串向量,该向量只有一个元素,就是空行之后的所有文本拼接之后的字符串#很多邮件都包含了非ASCII字符,因此设为latin1就可以读取非ASCII字符#readLines,读取每一行作为一个元素#异常捕获是自己加的,书上没有,不加会出错... 阅读全文
posted @ 2015-10-22 00:40 地表最强队队员 阅读(637) 评论(0) 推荐(0)
摘要:#均值:总和/长度mean()#中位数:将数列排序,若个数为奇数,取排好序数列中间的值.若个数为偶数,取排好序数列中间两个数的平均值median()#R语言中没有众数函数#分位数quantile(data):列出0%,25%,50%,75%,100%位置处的数据#可自己设置百分比quantile(d... 阅读全文
posted @ 2015-10-21 21:34 地表最强队队员 阅读(590) 评论(0) 推荐(0)
摘要:#使用数据:UFO数据#读入数据,该文件以制表符分隔,因此使用read.delim,参数sep设置分隔符为\t#所有的read函数都把string读成factor类型,这个类型用于表示分类变量,因此将stringsAsFactors设置为False#header=F表示文件中并没有表头#na.str... 阅读全文
posted @ 2015-10-21 19:40 地表最强队队员 阅读(728) 评论(0) 推荐(0)