摘要: 在生信分析中有许多时候我们需要用到除法,在经历无数次break out 之后我终于发现原来python 2.x中只有整除,而没有浮点除法,这就是没有基础的弊病。 那么如何在python 2.x中运用除法呢? 我们可以通过加载模块来实现浮点除法运算。 在代码最前面声明这个加载来实现浮点运算功能。 阅读全文
posted @ 2018-08-20 10:06 xjce 阅读(684) 评论(0) 推荐(0)
摘要: 生信数据文件一般是按列分开的,如果我们只想简单的提取一列而不是费尽周折写个程序提取哪一列的话,awk作为一个非常好用的文档处理工具,我们现在来简单看一下他的一些功能: 这里' '中是要输出的表达式,$1代表第一列,Input.txt是输入文件。 提取前两列。 提取之后的文件就可以用sort等命令进行 阅读全文
posted @ 2018-08-20 10:01 xjce 阅读(17042) 评论(0) 推荐(0)
摘要: 在生信分析的日常操作中,脚本中通常都会进行并行计算,那么屏幕上的信息就会乱的无从下手,无法获取我们需要的信息,因此并行计算的每一个计算单元都需要有对应的文件来记录程序运行的情况。 在shell脚本中常见的有这三种程序:shell,java和可执行程序。 首先对于shell和java程序,我发现可以用 阅读全文
posted @ 2018-08-09 10:01 xjce 阅读(389) 评论(0) 推荐(0)
摘要: 今天写了一个两个基因集找相同的基因然后输出这么个小程序就无论如何也跑不起来,原因出在循环嵌套上,这方面之前就出过问题,后来阴差阳错的就好了我也没太注意,但是最近这个问题严重制约了工作效率,我决心找到问题的所在。 这是今天可以跑的版本,我之前的错误在于把文件循环嵌套在了列表循环中,因为文件相对小一点, 阅读全文
posted @ 2018-08-06 10:58 xjce 阅读(9729) 评论(0) 推荐(0)
摘要: 通过GATK calling出来的SNP如果使用UnifiedGenotype获得的SNP文件是分sample的,但是如果使用vcftools或者ANGSD则需要Vcf文件是multi-sample的,这里就需要我们将不同samples的文件进行合并,可以通过vcftools的perl模块进行,但是 阅读全文
posted @ 2018-07-13 15:07 xjce 阅读(8886) 评论(0) 推荐(0)
摘要: 大圣,此去欲何? 踏南天,碎凌霄! 若一去不回。。。 便一去不回! 便 一去不回! 阅读全文
posted @ 2018-07-13 12:33 xjce 阅读(265) 评论(0) 推荐(0)
摘要: 只要有ENA千万别用NCBI!!!! 最近开始分析网上Download的数据,一开始用人家现成的GWAS数据,后来觉得反正自己的数据到手该做的也是要做的,出来混早晚是要还的,所以就开始从头分析一些SRA的数据,我以为会很简单,事实证明是我简单了。 首先我们下了这样的一串数据,*.sra格式: 这些数 阅读全文
posted @ 2018-07-13 12:30 xjce 阅读(2457) 评论(0) 推荐(0)
摘要: 在对vcf的操作有这样三个软件: 利用Bcftools按样本拆分文件主要利用了“--view”这个软件包,主要代码如下: 这里面三个参数: 就可以完成了。 阅读全文
posted @ 2018-07-13 10:05 xjce 阅读(4245) 评论(0) 推荐(0)
摘要: 恢复内容开始 我们经常说幻想着使用已有数据发表高分文章,的确,这样的童话故事每天都在发生,但如何走出第一步我们很多小伙伴不清楚,那么我们就从水稻SNP数据库的使用来讲起。 这是3k的水稻变异库,上面保存着现成的SNP,由于数据过大,网站的维护方使用了Plink的格式来给我们在线储存SNP的信息,可以 阅读全文
posted @ 2018-07-13 09:53 xjce 阅读(3523) 评论(0) 推荐(0)
摘要: 昨天听了师姐的开题,觉得有些坑我也可能掉进去,所以写了这么一篇随笔,警示我们大家一些开题的注意事项。 真心希望希望我开题的时候可以避开这些坑。 开题的要求: 阅读全文
posted @ 2018-05-24 08:39 xjce 阅读(532) 评论(0) 推荐(0)