0

R与金钱游戏:均线黄金交叉1

双11临近的我发现自己真的很穷很穷很穷(重要的问题说三遍)…… 贫穷催人上进。于是我就寻思着在空闲时间自己捣鼓一下钱生钱的游戏是怎么玩的,毕竟就算注定做韭菜也要做一根有知识有理想的韭菜。 第一个要玩的模型就是股票交易中的均线黄金交叉。 作为一个基础的韭菜一定听说过均线黄金交叉原则,也就是说当短期移动 ...

yukiwu 发布于 2019-11-07 23:07 评论(0)阅读(26)
0

用ggplot包画一个简单饼图

首先用library函数加载ggplot2包 接下来,进行数据准备: 我们已经有了一个一维数组,而data.frame是将这个数组转换为二维,print的结果是这样的: 接下来,用一个函数画饼图: factor(1)指的是将x的值以相同的参数设定,这里设为factor(1)。 用‘+’设置其他参数, ...

然年酉鱼 发布于 2019-11-02 11:40 评论(0)阅读(33)
0

R语言dai xie

R语言,Python长期招代写,作业量充足,需要一定英文能力,价格满意。有意者请留言联系,谢谢 ...

肖凯文 发布于 2019-10-21 09:55 评论(3)阅读(43)
0

R语言构建蛋白质网络并实现GN算法

R语言构建蛋白质网络并实现GN算法 [toc] 1.蛋白质网络的构建 我们使用与人类HIV相关的蛋白质互作数据hunam HIV PPI.csv来构建这个蛋白质互作网络。 在R中,我们可以从存储在R环境外部的文件读取数据。还可以将数据写入由操作系统存储和访问的文件。 R可以读取和写入各种文件格式,如 ...

yaliyali 发布于 2019-09-22 22:35 评论(0)阅读(190)
0

获取豆瓣电影数据(R与API获取网页数据)

一般成熟的网站都会有反爬虫策略,例如限制访问次数,限制访问 IP,动态显示数据等。爬虫和反爬虫就是一直相爱相杀地互相钳制。如果要通过爬虫来获取某些大型网站的数据,那是一件很费时费力的活。小白总遭遇过在趟过各种坑之前就被封 IP 或封账号的打击(呜呜~说的就是我)。 不过有一些公司心怀开放互联的态度, ...

yukiwu 发布于 2019-08-30 18:27 评论(0)阅读(327)
0

链家广州二手房的数据与分析——数据分析2

继续 "上一篇" 的工作继续分析广州链家二手房的数据。 Normality Test 用nortest package 的 ad.test() 分别对三个主要因素(面积,总价和均价)进行正态分布检验,结果显示这三个变量都不满足正态分布,而 Q Q Plot 的表现方式就更直观了: 房子的面积 r t ...

yukiwu 发布于 2019-08-11 12:01 评论(1)阅读(228)
0

R语言入门1:安装R和RStudio

R语言入门1:安装R和RStudio 曹务强 中科院遗传学博士研究生 曹务强 中科院遗传学博士研究生 曹务强 中科院遗传学博士研究生 曹务强 曹务强 曹务强 中科院遗传学博士研究生 中科院遗传学博士研究生 中科院遗传学博士研究生 9 人赞同了该文章 1. Windows安装R 在Windows系统上 ...

功夫 熊猫 发布于 2019-08-07 11:47 评论(0)阅读(172)
0

R Data Frame

https://www.datamentor.io/r-programming/data-frame/ Check if a variable is a data frame or not We can check if a variable is a data frame or not using ...

功夫 熊猫 发布于 2019-08-07 02:03 评论(0)阅读(79)
0

链家广州二手房的数据与分析——数据分析1

上一篇分享了 "爬取链家二手房的数据" ,接下来就应该是分析这份数据。 小插曲:懒洋洋的夏天到了连人也变得懒洋洋的了(借口!)。拖拖拉拉地等到了链家网页改版等到了二手房放盘数目又多了 10,000 + 套(楼市小复苏?),总之又不得不重新爬了一份 51,000 + 的 "数据" 。 Inspect ...

yukiwu 发布于 2019-07-30 19:30 评论(4)阅读(479)
0

初次用R的实际案例数据分析

这是一次教授布置的期末作业,也是书籍《商务数据分析与应用》的一个课后作业 目录 数据描述 数据预处理 描述性统计分析 模型分析(方差分析) 数据描述 非学位职业培训机构的178个学员的数据,目的是了解什么样的学员可能获得更好的学习效果 数据预处理 打开数据,查看一部分数据并锁定数据(这样之后可以直接 ...

kisaragiRY 发布于 2019-07-24 14:25 评论(0)阅读(194)
0

KEGG富集分析散点图.md

输入数据格式 pathway = read.table("kegg.result",header=T,sep="\t") pp = ggplot(pathway,aes(richFactor,Pathway)) Pathwy是ID,richFactor是富集的基因数目除以背景的基因数目 改变点的大小 ...

raisok 发布于 2019-06-13 08:37 评论(0)阅读(509)
0

画相关性热图

数据格式如下 Sample CM11 CM12 CM13 CM21 CM22 CM23 CM31 CM32 CM33 CM11 1 0.9627369 0.9884578 0.9841946 0.9762492 0.983613 0.9575127 0.743262 0.6178 CM12 0.96 ...

raisok 发布于 2019-06-12 16:24 评论(0)阅读(289)
0

链家广州二手房的数据与分析——爬取数据

之前在博客分享了利用 R 和 rvest 包爬虫的基础方法。现在就来实战一下:爬取链家网广州 40,000+ 套二手房的数据。 之前在 "Web Scraping with R" 说过的爬虫方法在这篇中就不在赘述了。这里就分享怎么样爬取网站中翻页的数据。 Web Scraping across Mu ...

yukiwu 发布于 2019-06-07 11:27 评论(0)阅读(426)
0

Web Scraping with R: How to Fill Missing Value (爬虫:如何处理缺失值)

网络上有大量的信息与数据。我们可以利用爬虫技术来获取这些巨大的数据资源。 这次用 IMDb 网站的 "2018年100部最欢迎的电影" 来练练手,顺便总结一下 R 爬虫的方法。 Preparation 感谢 Hadley Wickham 大大,我们有 包可以用。因此爬虫前先安装并加载 包。 Down ...

yukiwu 发布于 2019-06-05 13:00 评论(0)阅读(145)
0

Rust所有权语义模型

编程语言的内存管理,大概可以分为自动和手动两种。 自动管理就是用 GC(垃圾回收)来自动管理内存,像 Java、Ruby、Golang、Elixir 等语言都依赖于 GC。而 C/C++ 却是依赖于手工管理内存,程序员使用 malloc 和 free 函数来分配释放内存。 GC技术经过这么多年的发展 ...

tiana_Z 发布于 2019-06-04 14:42 评论(0)阅读(61)
0

Word Cloud (词云) - R

在前面已经陆续总结了如何用 "Python" 和 "JavaScript" 创建词云了,今天要说的是 R。其实 SPSS 和 SAS 的 Word Cloud 扩展模板都是基于 R 实现的。 Create Word Cloud via R 1) 准备文本。 我们再…再次使用上次保存的 Word Cl ...

yukiwu 发布于 2019-06-02 18:18 评论(0)阅读(77)
0

数据框筛选特定的子集

a=read.table(file = "H_V75_ENSG,T,P_type-mart_export.txt",header = TRUE,sep = "\t")#以数据框格式读取原文件pro_cod=a[a$Gene.Biotype=="protein_coding",]#筛选出数据框中第四列 ...

杜泽乾 发布于 2019-05-31 10:51 评论(0)阅读(109)