01 2017 档案

摘要:python 版本为 2.7.3,在用 pip 和 源代码都无法安装的情况下,用下述方法安装了 阅读全文
posted @ 2017-01-17 23:44 liuhui_pine 阅读(700) 评论(1) 推荐(0)
摘要:用法: 输入文件为 fasta 格式文件,若输入文件中序列的 header 有 '+' 或 ' ' 号标记正负链,则带有 '+' 的序列保持不变,带有 ' ' 的序列反向互补; 若 header 没有 '+' 或 ' ' 号标记, 则默认按反义链处理。 阅读全文
posted @ 2017-01-15 00:17 liuhui_pine 阅读(612) 评论(0) 推荐(0)
摘要:注:该脚本适用于序列不断开的情况 可用一下命令将折行的序列合并为一行 运行脚本 升级版,输入文件是 fasta 格式即可。用 Bio 中的 Seq.IO 解析 fasta 文件, 用 python 的内置函数 count() 的计算速度更快。 阅读全文
posted @ 2017-01-14 03:25 liuhui_pine 阅读(6265) 评论(0) 推荐(1)
摘要:``` import sys in_file = open(sys.argv[1]) out_file = open(sys.argv[2], 'w') lis = [x.split() for x in in_file] for x in zip(*lis): for y in x: print >> out_file, y + '\t', print >>... 阅读全文
posted @ 2017-01-13 23:22 liuhui_pine 阅读(198) 评论(0) 推荐(0)
摘要:``` Variant Call Format(VCF)是一个用于存储基因序列突变信息的文本格式。表示单碱基突变, 插入/缺失, 拷贝数变异和结构变异等。BCF格式文件是VCF格式的二进制文件。 CHROM [chromosome]: 染色体名称。 POS [position]: 参考基因组突变碱基位置,如果是INDEL(插入缺失),位置是INDEL的第一个碱基位置。 I... 阅读全文
posted @ 2017-01-03 19:51 liuhui_pine 阅读(6346) 评论(0) 推荐(0)