01 2015 档案
摘要:RWeka(http://cran.r-project.org/web/packages/RWeka/index.html) :1) 数据输入和输出WOW():查看Weka函数的参数。Weka_control():设置Weka函数的参数。read.arff():读Weka Attribute-Rel...
阅读全文
摘要:When it comes to theNBA draft, experts tend to argue about a number of things: at whichposition willa player be selected? what is the best draft class...
阅读全文
摘要:Jay&I cover dashboards in Chapter 10 ofData-Driven Security(the book) but have barely mentioned them on the blog. That’s about to change with a new se...
阅读全文
摘要:RFM模型:R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M (Monetary)表示客户在最近一段时间内购买的金额。一般原始数据为3个字段:客户ID、购买时间、购买金额,用数据挖掘软件处理,加权(考虑权重)得到RFM得分,对得分排...
阅读全文
摘要:正好刚帮某电信行业完成一个数据挖掘工作,其中的RFM模型还是有一定代表性,就再把数据挖掘RFM模型的建模思路细节与大家分享一下吧!手机充值业务是一项主要电信业务形式,客户的充值行为记录正好满足RFM模型的交易数据要求。 根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇...
阅读全文
摘要:对着满屏的游戏后台数据,需要快速了解数据特征,一种茫然无从下手的感觉?本文在游戏后台数据中,如何通过R语言快速的了解游戏后台的数据特征,以及统计各个数据之间的相关系数,并通过相关图来发现其中相关系数较高的数据,从而通过R得到高相关系数之间的线性回归方程,最后通过矩阵散点图来初步发现数据中的一些规律解...
阅读全文
摘要:聚类分析:对样品或指标进行分类的一种分析方法,依据样本和指标已知特性进行分类。本节主要介绍层次聚类分析,一共包括3个部分,每个部分包括一个具体实战例子。1、常规聚类过程:一、首先用dist()函数计算变量间距离dist.r = dist(data, method=" ") 其中method包括6种方...
阅读全文
摘要:R语言绘制地图,在数据分析中经常能够用到,并且会达到非常好的展示效果,本节以例子形式,介绍如何使用R语言工具,画出理想的地图。本节例子在 R version 2.15.3版本下运行顺畅,其他版本待定。代码如下:第一个小例子#加载相应的包,并读入数据,最后画图。library(maptools);li...
阅读全文
摘要:对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去,一直到遇到下一个问题再回来。当然,这不是最好的学习方式,最好的方式是——看书。目前,市面上介绍R语言的书籍很多,中文英文都有。那么,众多书籍中,一个生手应该从哪一本着手呢?入门之后如何才能把自己练就成某...
阅读全文
摘要:In this post I will run SAS exampleLogistic Regression Random-Effects Modelin four R based solutions; Jags, STAN, MCMCpack and LaplacesDemon. To quote...
阅读全文
摘要:1. SparkR的安装配置1.1. R与Rstudio的安装1.1.1. R的安装我们的工作环境都是在Ubuntu下操作的,所以只介绍Ubuntu下安装R的方法:1) 在/etc/apt/sources.list添加源deb http://mirror.bjtu.edu.cn/cran/bin/l...
阅读全文
摘要:转自:http://blog.fens.me/r-math-derivative/前言高等数学是每个大学生都要学习的一门数学基础课,同时也可能是考完试后最容易忘记的一门知识。我在学习高数的时候绞尽脑汁,但始终都不知道为何而学。生活和工作基本用不到,就算是在计算机行业和金融行业,能直接用到高数的地方也...
阅读全文
摘要:转自:http://blog.chinaunix.net/uid-10540984-id-2942041.html文件:1234567abcdefg......现在想要随机抽取5列组成下面的内容,允许重复:36612cffab......1 awk -F '' 'BEGIN{srand();for(...
阅读全文
摘要:rm(list=ls())path='J:/lab/EX29--在R语言中进行文件(夹)操作'setwd(path)cat("fileA\n",file="A")#创建一个文件A,文件内容是'fileA','\n'表示换行,这是一个很好的习惯cat("fileB\n",file="B")#创建一个文...
阅读全文
摘要:转自:http://my.oschina.net/leejun2005/blog/100710最近有需求需要本地处理一些临时的数据,用做统计分析。如果单纯的 MYSQL 也能实现,不过一堆临时数据这样从 mysql 导来导去还是挺麻烦的,比较理想的选择是本机装个 cygwin环境,然后可以用 awk...
阅读全文

浙公网安备 33010602011771号