文章分类 -  R

R语言技术学习交流
摘要:前言: 又有很长的一段时间没有更新博客了,距离上次更新已经有两个月的时间了。其中一个很大的原因是,不知道写什么好-_-,最近一段时间看了看关于SVM(Support Vector Machine)的文章,觉得SVM是一个非常有趣,而且自成一派的方向,所以今天准备写一篇关于关于SVM的文章。 关于SV 阅读全文
posted @ 2016-09-08 00:30 payton数据之旅 阅读(195) 评论(0) 推荐(0)
摘要:前言: 决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快速,模型容易展示(容易将得到的决策树做成图片展示出来)等。但是同时,单决策树又有一些不好的地方,比如说容易over-fitting,虽然有一些方法,如剪枝可以减少这种情况,但是还是不够的。 模型组合(比如说有Boos 阅读全文
posted @ 2016-09-08 00:26 payton数据之旅 阅读(170) 评论(0) 推荐(0)
摘要:GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力(genera 阅读全文
posted @ 2016-09-08 00:19 payton数据之旅 阅读(606) 评论(0) 推荐(0)
摘要:一、贝叶斯网络与朴素贝叶斯的区别 朴素贝叶斯的假设前提有两个第一个为:各特征彼此独立;第二个为且对被解释变量的影响一致,不能进行变量筛选。但是很多情况这一假设是无法做到的,比如解决文本分类时,相邻词的关系、近义词的关系等等。彼此不独立的特征之间的关系没法通过朴素贝叶斯分类器训练得到,同时这种不独立性 阅读全文
posted @ 2016-08-18 15:23 payton数据之旅 阅读(3422) 评论(0) 推荐(0)
摘要:Introduction In R, we often use multiple packages for doing various machine learning tasks. For example: we impute missing value using one package, th 阅读全文
posted @ 2016-08-08 15:20 payton数据之旅 阅读(940) 评论(0) 推荐(0)
摘要:简单说下安装过程,一般不会有问题,重点是RMySQL的使用方式。 系统环境说明 Redhat系统:Linux 460-42.6.32-431.29.2.el6.x86_64 系统编码:LANG=zh_CN.UTF-8(中文UTF-8格式) mysql版本:mysql Ver 14.14 Distri 阅读全文
posted @ 2016-08-02 19:01 payton数据之旅 阅读(1443) 评论(0) 推荐(0)
摘要:参考:xccd ,肖凯大牛的博客 ########## caret 包总结 ########### 使用caret::mdrr 1、降维 a)删除的变量是常数自变量,或者是方差极小的自变量: nearZeroVar:诊断预测变量是唯一值(即0方差自变量) nearZeroVar(x, freqCut 阅读全文
posted @ 2016-08-01 15:17 payton数据之旅 阅读(1152) 评论(0) 推荐(0)
摘要:决策树经验熵是针对所有样本的分类结果而言经验条件熵是针对每个特征里每个特征样本分类结果之特征样本比例和基尼不纯度简单地说就是从一个数据集中随机选取子项,度量其被错误分类到其他分组里的概率决策树算法使用轴平行分割来表现具体一定的局限性C5.0算法--可以处理数值型和缺失 只使用最重要的特征--使用的熵 阅读全文
posted @ 2016-07-25 10:52 payton数据之旅 阅读(2123) 评论(0) 推荐(0)
摘要:组合预测模型 基于R语言的模型组合 组合预测模型的普遍形式为各个单项预测模型的加权平均, 因此组合预测模型的重点在于加权系数的确定。如果对各个单项预测模型的加权系数赋值合理, 那么整个组合预测模型的预测精度也会相应提高。目前常用的方法有算术平均法、 最优权数法、 方差倒数法等方差倒数法是 Bates 阅读全文
posted @ 2016-07-25 10:40 payton数据之旅 阅读(3677) 评论(0) 推荐(0)
摘要:R-xgboost模型 是"极端梯度上升"(Extreme Gradient Boosting)的简称 xgboost: 速度快效果好的boosting模型 [plain] view plain copy install.packages("xgboost") library(xgboost) da 阅读全文
posted @ 2016-07-25 10:34 payton数据之旅 阅读(997) 评论(0) 推荐(0)
摘要:Today’s post is by Thomas Yokota, an epidemiologist in Hawaii. I’ve been corresponding with Thomas via email and telephone for a while. I asked Thomas 阅读全文
posted @ 2016-06-21 16:36 payton数据之旅 阅读(288) 评论(0) 推荐(0)
摘要:Two years ago, I published a book -- written in Japanese so I'm afraid most of the readers can't read it :'( Actually this book was written as a summa 阅读全文
posted @ 2016-04-25 21:06 payton数据之旅 阅读(213) 评论(0) 推荐(0)
摘要:This post was kindly contributed by 数据科学与R语言 - go there to comment and to read the full post. 最近帮朋友写了一个灰色模型GM(1,1)的R实现,参考网上现有的matlab代码,比较容易就可以弄出来。下面是... 阅读全文
posted @ 2015-06-29 19:53 payton数据之旅 阅读(2123) 评论(0) 推荐(0)
摘要:本期内容导读150行代码写出游戏2048,哪种语言能实现?答案是R语言。虽然R语言并不适合做游戏开发,但是R语言中的向量计算,能极大地简化算法的复杂度,可以高效的完成计算任务。掌握R中的计算方法,将会起到事半功倍的效果。本周将给大家介绍R语言中计算方法的选择与程序效率的提高。1 读取大文件不管我们用... 阅读全文
posted @ 2015-06-24 11:30 payton数据之旅 阅读(379) 评论(0) 推荐(0)
摘要:上期内容回顾上一期我们主要给大家介绍了用R求解线性方程组的解,超定方程组,非线性方程的线性求法。本期内容导读这一周包括两部分内容:第一部分为向量化计算,主要介绍了向量化计算的思想,并以apply族函数(apply,sapply,lappy,tapply等函数)为例进行了示范;第二部分主要讲解在R中求... 阅读全文
posted @ 2015-06-17 13:21 payton数据之旅 阅读(733) 评论(0) 推荐(0)
摘要:上期内容回顾上一周给大家介绍了R在矩阵方面的相关计算,包括矩阵的基本运算;矩阵的分解;行列式的相关运算。本期内容导读在这一周中,将接着给大家介绍R在线性代数方面的应用。通过本节的学习,您将能运用R求解线性方程组的解,超定方程组,非线性方程的线性求法。1.线性方程组的求法1.1 克莱姆法则克莱姆法则,... 阅读全文
posted @ 2015-06-17 13:10 payton数据之旅 阅读(1932) 评论(1) 推荐(1)
摘要:上期内容回顾上一期我们主要给大家介绍了R在数学方面的基本运算,主要包括加减乘除四则运算、复数计算、最小公倍数、阶乘、组合数、求解方程组等内容。本期内容导读这一周将接着给大家介绍 R在矩阵运算的相关计算。通过对本文的学习,你将会掌握矩阵的创建,矩阵的基本运算,矩阵的分解;行列式的相关运算。1. 矩阵相... 阅读全文
posted @ 2015-06-03 15:58 payton数据之旅 阅读(499) 评论(0) 推荐(0)
摘要:前言本小节主要是抛砖引玉,对股市感兴趣的小白们亲自下载并分析股市数据,提供一个实战化的操作过程。因此,本节内容不重理论,只讲操作过程。若感兴趣,可自行深入研究各种金融模型。本节内容导读R语言quantmod包是用于股市金融建模应用比较多的一个包。该包从多个数据源获取历史数据,绘制金融数据图表,以及在... 阅读全文
posted @ 2015-06-03 15:52 payton数据之旅 阅读(2726) 评论(0) 推荐(0)
摘要:R是作为统计语言,只要一个简单的函数就能实现复杂的数学计算,所以R语言进行数学计算具有很好的优势。本文主要介绍R在数学方面的计算。1. 基本运算1.1 四则运算四则是指加法、减法、乘法、除法的计算法则。 example:x<-10y<-20x-y; x+y; x/y; x*y;## [1] -10#... 阅读全文
posted @ 2015-06-03 15:50 payton数据之旅 阅读(442) 评论(0) 推荐(0)
摘要:In the R environment, different packages to draw maps are available. I lost the count by now; surely,spandggmapdeserve consideration. Despite the grea... 阅读全文
posted @ 2015-01-21 09:56 payton数据之旅 阅读(306) 评论(0) 推荐(0)