04 2015 档案
摘要:By Greg Gage (Neuroscientist)Greg Gage is on a mission to make brain science accessible to all. In this fun, kind of creepy(令人毛骨悚然的,恐怖的) demo, the neu...
阅读全文
摘要:Introduction to Random forest(Simplified)With increase in computational power, we can now choose algorithms which perform very intensive calculations....
阅读全文
摘要:基本的R包已经实现了传统多元统计的很多功能,然而CRNA的许多其它包提供了更深入的多元统计方法,下面要综述的包主要分为以下几个部分:1) 多元数据可视化(Visualising multivariate data):绘图方法:基本画图函数(如:pairs()、coplot())和lattice包里的...
阅读全文
摘要:机器学习是计算机科学和统计学的边缘交叉领域,R关于机器学习的包主要包括以下几个方面: 1)神经网络(Neural Networks): nnet、AMORE以及neuralnet,nnet提供了最常见的前馈反向传播神经网络算法。AMORE包则更进一步提供了更为丰富的控制参数,并可以增加多个隐...
阅读全文
摘要:By Nizar Ibrahim A 50-foot-long carnivore who hunted its prey in rivers 97 million years ago, the spinosaurus is a "dragon from deep time." Paleontologist Nizar Ibrahim and his c...
阅读全文
摘要:数据结构一、数据管理vector:向量 numeric:数值型向量 logical:逻辑型向量 character;字符型向量 list:列表 data.frame:数据框 c:连接为向量或列表 length:求长度 subset:求子集 s...
阅读全文
摘要:一. 批量生成文件夹,批量读取文件夹名称 今日,工作中遇到这样一个问题:boss给我们提供了200多家公司的ID代码(如6007、7920等),需要根据这些ID号去搜索下载新闻,从而将下载到的新闻存到以公司ID生成的指定文件夹下!所以第一个问题就是200多个公司,不可能每一次下载,都要去点击:新建文件夹,然后对文件夹命名,too boring and monotonous。嘿嘿,幸好有R的陪伴!...
阅读全文
摘要:VLOOKUP 的语法结构整个计算机就相当于一门语言,首先我们就是要获取该函数的语法结构。以下是官网的语法结构VLOOKUP(lookup_value, table_array, col_index_num, [range_lookup])。表述的就是VLOOKUP(查找值,查找范围,查找列数,精确...
阅读全文
摘要:By Clint SmithAs kids, we all get advice from parents and teachers that seems strange, even confusing. This was crystallized one night for a young Cli...
阅读全文
摘要:在SQL查询中,经常会用到左连接、右连接、内连接、全连接,那么在R中如何实现这些功能,今天来讲一讲!SQL回顾原理# 连接可分为以下几类:内连接。(典型的连接运算,使用像 = 或 之类的比较运算符)。包括相等连接和自然连接。 内连接使用比较运算符根据每个表共有的列的值匹配两个表中的行。例如,检索...
阅读全文
摘要:方法不唯一 单变量正态检验主要的话包括以下这些 shapiro.test();#Shapiro-Wilk检验 library("nortest"); lillie.test() #Kolmogorov-Smirnov检验 ad.test() #Anderson-Darling正态性检验 cvm.test() #Cramer-von Mises正态性检验 pears...
阅读全文
摘要:By Chris Milk # Background about our speaker Working at the frontiers of interactive technology, Chris Milk stretches virtual reality into a new canvas(画布) for storytelling. # Why you should ...
阅读全文
摘要:R通常被用来进行数值计算比较多,字符串处理相对较少,而且关于字符串的函数也不多,用得多的就是substr、strsplit、paste、regexpr这几个了。实际上R关于字符串处理的功能是非常强大的,因为它甚至可以直接使用Perl的正则表达式,这也是R的一个理念,作为语言就把向量计算做到极致,作为环境,就在各领域都集成最好的。R中有grep系列的函数,可以用最强大的方式处理字符串的所有问题。 ...
阅读全文
摘要:这里用Hadley Wickham开发的rvest包。再次给这位矜矜业业开发各种好用的R包的大神奉上膝盖。 查阅资料如下: rvest的github rvest自身的帮助文档 rvest + CSS Selector 网页数据抓取的最佳选择-戴申 : 里面有提及如何快速获得html的位置。看完这篇,想想我之前看代码看半天分段真是逗比。。经测试,遨游浏览器,右键,审查元素可以...
阅读全文
摘要:干货一:经常有很多朋友会遇到这样一个问题:安装R版本使用了很久以后,在使用新packages时,提示这些包是基于更高版本的R构建的,因此,无法使用这些packages,一般的童鞋遇到这类问题可能非常苦恼,哀叹一声:妈蛋,又要重新下载R,下载了完了还要安装一堆R包,累觉不爱啊!其实啊!在实际使用中,早...
阅读全文
摘要:By Jedidah Isler# Background about our speakerJedidah Isler studies blazars(耀变天体) — supermassive hyperactive black holes(特大质量、极度活跃的黑洞) that emit power...
阅读全文
摘要:English daily notes 2015年 4月 Phrases 1. As a side note #作为附注,顺便说句题外话,和by the way意思相近,例句: @1:As a side note, there is no equivalent to tapply in the plyr package. 2. Across the range of #各种/各类/...
阅读全文
摘要:• Applications and Case Studies — Lessons and Experiences • Big Data Analytics • Biomedical and Health Data Mining • Business Analytics • Computational Aspects of Data Mining • Data Inte...
阅读全文
摘要:The hidden reason for poverty the world needs to address nowBy Gary Haugen# Background about our speakerAs founder of International Justice Mission, G...
阅读全文
摘要:题注:主成分分析分析与因子分析也有不同,主成分分析仅仅是变量变换,而因子分析需要构造因子模型。主成分分析:原始变量的线性组合表示新的综合变量,即主成分;因子分析:潜在的假想变量和随机影响变量的线性组合表示原始变量。因子分析与回归分析不同,因子分析中的因子是一个比较抽象的概念,而回归因子有非常明确的实...
阅读全文
摘要:一. 问题引入下面是一个房地产价格数据,现在想要提取2008年6月份的数据进行分析,在R中该如何操作呢? city price bedrooms squarefeet lotsize latitude longitude month
1 San Francisco 1470000 3 2424 NA 37.75651 -122....
阅读全文
摘要:最近在猛撸这本课,统计部分涉及的第一个分析数据的方法便是PCA!因此,今天打算好好梳理一下,涉及主城分析法的理论以及R实现!come on…gogogo…首先说一个题外话,记得TED上有一期,一个叫Simon Sinek的年轻人提出了一个全新的Why-How-What黄金圈理论(三个同心圆,最里面的...
阅读全文
摘要:My desperate journey with a human smugglerBy Barat Ali BatoorWhen I was a child there was a toy where you could put square, round, triangular and star...
阅读全文
摘要:天太晚了,该睡觉了,可是你的东西也许正在下载,软件正在更新,总之电脑还有一些工作没有完成,又不需要你人为的守着,随他去吧!可是电脑已经工作了一天了,它也要休息一下,再者也不能浪费电力资源呀,那么就来使用自动关机命令吧!既简单又实用。操作过程# 点击开始,运行,键入cmd点击确定# 键入指令at ...
阅读全文
摘要:详细步骤请看:http://home.cnblogs.com/group/topic/8550.html 。Windows Live Writer手工配置步骤(在博客园配置时输入用户名与密码会自动完成配置):1、在菜单中选择"Weblog";,然后选择"Another Weblog Service"...
阅读全文
摘要:今天看论文的时候又看到了协方差矩阵这个破东西,以前看模式分类的时候就特困扰,没想到现在还是搞不清楚,索性开始查协方差矩阵的资料,恶补之后决定马上记录下来,嘿嘿~本文我将用自认为循序渐进的方式谈谈协方差矩阵。统计学的基本概念学过概率统计的孩子都知道,统计里最基本的概念就是样本的均值,方差,或者再加个标...
阅读全文
摘要:Topic 1:Why we need to rethink capitalism By Paul Tudor Jones II # Background about our speaker Paul Jones is founder of Tudor Investment Corporation ...
阅读全文
摘要:English daily notes2015年4月PhrasesAs a side note 作为附注,顺便说句题外话,和by the way意思相近,例句As a side note, there is no equivalent to tapply in the plyr package.Ac...
阅读全文
摘要:R in Nutshell前言 例子(nutshell包)本书中的例子包括在nutshell的R包中,使用数据,需加载nutshell包install.packages("nutshell") 第一部分:基础 第一章批处理(Batch Mode)R provides a way to run a l...
阅读全文
摘要:Arules包详解 包基本信息 发布日期:2014-12-07 题目:挖掘关联规则和频繁项集 描述:提供了一个表达、处理、分析事务数据和模式(频繁项集合关联规则)的基本框架。 URL:http://R-Forge.R-project.org/projects/arules/,http://lyle....
阅读全文
摘要:Apriori algorithm是关联规则里一项基本算法。是由Rakesh Agrawal和Ramakrishnan Srikant两位博士在1994年提出的关联规则挖掘算法。关联规则的目的就是在一个数据集中找出项与项之间的关系,也被称为购物蓝分析 (Market Basket analysis)...
阅读全文
摘要:小伙伴儿们有福啦,2015年4月10日,Hadley Wickham大牛(开发了著名的ggplots包和plyr包等)和RStudio小组又出新作啦,新作品readr包和readxl包分别用于R读取text数据和Excel电子表格数据。事实上,R已经有了一堆读取数据的函数,比如read.table家...
阅读全文
摘要:一、软件准备。Word谁都有,所以软件准备这一步几乎可省略。具体哪一个版本开始有博客发布的功能我不知道,反正我用的是Word 2013。二、第一次使用必须的配置:打开一篇Word文档,然后点击左上角的"文件",依次选择"共享"-->"发布至博客": 一般会默认让你新建一个博客账户:博客文章地址为:h...
阅读全文

浙公网安备 33010602011771号