上一页 1 ··· 8 9 10 11 12 13 下一页
摘要: 在R中多图画到一起的时候,各图间距通常默认的较远。如下图: 1 par(mfcol=c(2,1)) 2 plot(1:100) 3 plot(1:100)调整图片间距这时我们要用到par()函数中的两个调节边距的参数,mar()和oma()。四个数字分别表示,下、左、上、右四个方向的内外边距,数值愈大距离越远;内外边距配合,缩减图间距。 1 par(mfcol=c(2,1),mar=c(1... 阅读全文
posted @ 2019-12-27 11:15 un-define 阅读(6620) 评论(0) 推荐(0)
摘要: 一、示例数据准备数据格式如下:二、作图1、直接作图结果如下,默认蓝色渐变。 1 ggplot(df,aes(x=BP_A,y=P.value,colour=R2))+ 2 geom_point(size=2,shape=16)2、双色梯度渐变,主要有函数scale_color_gradient()控制。 1 ggplot(df,aes(x=BP_A,y=P.value,colour=R2... 阅读全文
posted @ 2019-12-27 10:29 un-define 阅读(18935) 评论(0) 推荐(0)
摘要: 画图的时候,排序是个很重要的技巧,比如有时候会看下基因组每条染色体上的SNP的标记数量,这个时候直接做条形图是一种比较直观的方法,下面我们结合实际例子来看下:在R环境下之际构建一个数据框,一列染色体名称,一列统计数据。 1 chr<-paste("chr",c(1:18,"X","Y"),sep="") 2 set.seed(2) 3 num<-runif(20,100,5000) 4 d... 阅读全文
posted @ 2019-12-14 15:41 un-define 阅读(5103) 评论(0) 推荐(0)
摘要: 最近有需求,对WGS测序获得SNP信息进行筛减,可问题是测序个体少,call rate,maf,hwe,等条件过滤后,snp数量还是千万级别,所以后面利用plink工具根据LD信息来滤除大量SNP标记。工具版本:PLINK v1.90b4.6 64-bit (15 Aug 2017)一、格式转换首先将准备好的vcf文件转换下格式,map和ped格式: 1 plink --allow-extra-... 阅读全文
posted @ 2019-12-11 21:21 un-define 阅读(20437) 评论(2) 推荐(0)
摘要: 因为最近有一项工作是比较填充准确性的,中间有用到vcftools比较两个vcf文件。 使用命令也很简单: 1 vcftools --vcf file1.snp.vcf --diff file2.snp.vcf --diff-site --out Diff.site 运行结束会生成一个名为Diff.s 阅读全文
posted @ 2019-12-11 20:27 un-define 阅读(4841) 评论(0) 推荐(1)
摘要: 今天来学习下R中字符串处理操作,主要是stringr包中的字符串处理函数的用法。先导入stringr包,library(stringr),require(stringr),或者stringr::函数名;这几种方式都行。一、检测是否匹配我们先定义一个字符串和变量,在此基础上演示各个函数基本用法。 1 library(stringr) 2 animal<-c("cow","dog","sheep"... 阅读全文
posted @ 2019-12-03 10:05 un-define 阅读(7149) 评论(0) 推荐(0)
摘要: 这里记录两种perl数组去重的办法,一种利用哈希(hash),一种直接利用perl自带的模块List::MoreUtils内部的函数uniq。一、利用hash去重示例代码如下: 1 #!/usr/bin/perl -w 2 use strict; 3 4 my @list=qw /1 2 3 2 1 4 aa a bb c b bb d/; 5 foreach (@list){pri... 阅读全文
posted @ 2019-12-02 15:16 un-define 阅读(8403) 评论(0) 推荐(0)
摘要: 在linxu平台下少不了对变量名的处理,今天记录下shell中 ##%% 对变量名的操作。 #操作左侧,%操作右侧。 #号处理方式: 对于单个#,处理对象为变量中指定的第一个符号左侧字符串, 对于两个##,处理对象为变量中指定的最后一个符号左侧字符串。 %号处理方式: 对于单个%,操作对象是变量中指 阅读全文
posted @ 2019-12-02 11:23 un-define 阅读(2166) 评论(0) 推荐(0)
摘要: 做群体变异检测后,通常会有提取子集的操作,之前没有发现bcftools有这个功能,都是自己写脚本操作,数据量一上来,速度真的是让人无语凝噎。这里记录下提取子vcf文件的用法,软件版本:bcftools-1.5 一、根据个体提取子集 根据样品名提取vcf文件,准备要保留的个体名文件 keep.list 阅读全文
posted @ 2019-11-27 21:24 un-define 阅读(21827) 评论(6) 推荐(2)
摘要: 今天有个统计需求,需要对应的元素的列求和,文件示例如下: 1 ID1 0 2 7 2 ID2 1 5 6 3 ID3 2 2 6 4 ID4 1 6 0 5 ID2 3 8 3 6 ID2 0 8 3 7 ID4 2 2 9 8 ID2 3 7 7 9 ID1 1 5 3 10 ID2 2 3 7 阅读全文
posted @ 2019-11-25 22:09 un-define 阅读(1932) 评论(0) 推荐(0)
上一页 1 ··· 8 9 10 11 12 13 下一页