• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
Aimeenice
博客园    首页    新随笔    联系   管理    订阅  订阅
用bcftools将多个vcf文件合并成一个vcf文件 或将多个vcf和合并成的vcf文件拆分成单个样本的vcf文件

1. 软件的安装

a. bcftools 的安装

b. bgzip的安装: https://blog.csdn.net/weixin_30471065/article/details/95108525

下载链接:https://github.com/samtools/htslib/releases/download/1.2.1/htslib-1.2.1.tar.bz2

2. 合并

第一步: 

用bgzip将所有的vcf文件压缩

bgzip -c -f f_nist_1_2.vcf > f_nist_1_2.vcf.gz

第二步:

用bcftools 对每一个压缩好的vcf文件建立index

bcftools index f_nist_1_2.vcf.gz

第三步:

用bcftools将压缩好的所有vcf文件进行合并

bcftools merge fc_nist_1_1.vcf.gz fc_nist_1_2.vcf.gz fc_nist_1_3.vcf.gz fc_nist_1_4.vcf.gz fc_nist_2_1.vcf.gz fc_nist_2_2.vcf.gz fc_nist_2_3.vcf.gz fc_nist_2_4.vcf.gz -Oz -o merge.vcf.gz

任务完成,得到最后合并好的vcf文件。

bcftools文件的一些使用方法:

http://www.htslib.org/doc/1.0/bcftools.html

bgzip的使用方法参考网址:

http://www.htslib.org/doc/bgzip.html

 

拆分成单个样本的vcf文件:

1、下载安装bcftools。

2、准备样本ID文件,这里命名为samplelistname.txt,一个样本一行,如下所示:

sample1

sample2

sample3

3、输入命令:

bcftools view -S samplelistname.txt /1000genomes/ALL.chr16.phase3_shapeit2_mvncall_integrated_v5a.20130502.genotypes.vcf.gz -Ov > samplelist_1000Genomes.vcf
posted on 2021-05-23 21:26  Aimeenice  阅读(10883)  评论(0)    收藏  举报
刷新页面返回顶部
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3