随笔分类 - R language
摘要:Comprehensive learning path – Data Science in PythonJourney from a Python noob to a Kaggler on PythonSo, you want to become a data scientist or may be...
阅读全文
摘要:数据结构一、数据管理vector:向量 numeric:数值型向量 logical:逻辑型向量 character;字符型向量 list:列表 data.frame:数据框 c:连接为向量或列表 length:求长度 subset:求子集 s...
阅读全文
摘要:一. 批量生成文件夹,批量读取文件夹名称 今日,工作中遇到这样一个问题:boss给我们提供了200多家公司的ID代码(如6007、7920等),需要根据这些ID号去搜索下载新闻,从而将下载到的新闻存到以公司ID生成的指定文件夹下!所以第一个问题就是200多个公司,不可能每一次下载,都要去点击:新建文件夹,然后对文件夹命名,too boring and monotonous。嘿嘿,幸好有R的陪伴!...
阅读全文
摘要:在SQL查询中,经常会用到左连接、右连接、内连接、全连接,那么在R中如何实现这些功能,今天来讲一讲!SQL回顾原理# 连接可分为以下几类:内连接。(典型的连接运算,使用像 = 或 之类的比较运算符)。包括相等连接和自然连接。 内连接使用比较运算符根据每个表共有的列的值匹配两个表中的行。例如,检索...
阅读全文
摘要:干货一:经常有很多朋友会遇到这样一个问题:安装R版本使用了很久以后,在使用新packages时,提示这些包是基于更高版本的R构建的,因此,无法使用这些packages,一般的童鞋遇到这类问题可能非常苦恼,哀叹一声:妈蛋,又要重新下载R,下载了完了还要安装一堆R包,累觉不爱啊!其实啊!在实际使用中,早...
阅读全文
摘要:题注:主成分分析分析与因子分析也有不同,主成分分析仅仅是变量变换,而因子分析需要构造因子模型。主成分分析:原始变量的线性组合表示新的综合变量,即主成分;因子分析:潜在的假想变量和随机影响变量的线性组合表示原始变量。因子分析与回归分析不同,因子分析中的因子是一个比较抽象的概念,而回归因子有非常明确的实...
阅读全文
摘要:R in Nutshell前言 例子(nutshell包)本书中的例子包括在nutshell的R包中,使用数据,需加载nutshell包install.packages("nutshell") 第一部分:基础 第一章批处理(Batch Mode)R provides a way to run a l...
阅读全文
摘要:Arules包详解 包基本信息 发布日期:2014-12-07 题目:挖掘关联规则和频繁项集 描述:提供了一个表达、处理、分析事务数据和模式(频繁项集合关联规则)的基本框架。 URL:http://R-Forge.R-project.org/projects/arules/,http://lyle....
阅读全文
摘要:Apriori algorithm是关联规则里一项基本算法。是由Rakesh Agrawal和Ramakrishnan Srikant两位博士在1994年提出的关联规则挖掘算法。关联规则的目的就是在一个数据集中找出项与项之间的关系,也被称为购物蓝分析 (Market Basket analysis)...
阅读全文
摘要:小伙伴儿们有福啦,2015年4月10日,Hadley Wickham大牛(开发了著名的ggplots包和plyr包等)和RStudio小组又出新作啦,新作品readr包和readxl包分别用于R读取text数据和Excel电子表格数据。事实上,R已经有了一堆读取数据的函数,比如read.table家...
阅读全文

浙公网安备 33010602011771号