摘要: 例如将一个BLM.txt文件分成前缀为 BLM_ 的1000个小文件,后缀为系数形式,且后缀为4位数字形式 先利用 再利用 split 命令 这里参数-l是每个小文件的行数,最大不能超过要分割文件的行数,后面接要分割的文件,-d 是指系数是数字而不是字母 -a 是指系数是四位数。而后面BLM_是系数 阅读全文
posted @ 2018-04-21 21:02 xjce 阅读(6145) 评论(0) 推荐(0)
摘要: 在生信分析中,经常会遇到不同的重复和处理,这样的分析过程有时是非常费时且占用资源并不是很多的,可以同时在后台运行以节约时间,这是并行处理的意义。除了需要并行处理,循环迭代来遍历整个文件夹的需要分析的数据也是非常消耗精力和时间的,按照宁可花费机器一分钟绝不浪费程序员一秒钟的精神,我决定开始探索并行循环 阅读全文
posted @ 2018-04-21 10:18 xjce 阅读(7273) 评论(2) 推荐(0)
摘要: 在分析数据时,经常会有许多机械重复的命令带入,作为一个半路出家的程序猿,我曾经对这种工作束手无策。不像一个熟手那样举重若轻的分析,感觉自己的生信分析完全是个体力活。为了打开这样的局面,我开始学习如何批量处理这些文件名格式差不多的文件。 这是一个批量处理sam2bam的脚本,可以遍历work_dir中 阅读全文
posted @ 2018-04-17 16:41 xjce 阅读(3436) 评论(0) 推荐(0)