plink软件maf过滤24号染色体异常

 

001、

root@PC1:/home/test# ls
outcome.map  outcome.ped
root@PC1:/home/test# cat outcome.map     ## 测试数据,均为24号染色体数据
24      snp1    0       260996
24      snp2    0       363750
24      snp3    0       299533
root@PC1:/home/test# cat outcome.ped
DOR     1       0       0       0       -9      A A     A G     A A
DOR     2       0       0       0       -9      A A     G G     A A
DOR     3       0       0       0       -9      A A     A A     A A
DOR     4       0       0       0       -9      A A     G G     A A
DOR     5       0       0       0       -9      A A     G G     A A
DOR     6       0       0       0       -9      A A     A G     A A

 

 

002、利用maf参数过滤

root@PC1:/home/test# plink --file outcome --maf 0.01 --recode tab --out test &>/dev/null; rm *.log *.nosex
root@PC1:/home/test# ls    ## 过滤结果, test*文件
outcome.map  outcome.ped  test.map  test.ped
root@PC1:/home/test# cat test.map      ##  maf命令并没有起作用,而且snp顺序发生了变化
24      snp1    0       260996
24      snp3    0       299533
24      snp2    0       363750
root@PC1:/home/test# cat test.ped           ## 仍然有没有多态性的位点
DOR     1       0       0       0       -9      A A     A A     A G
DOR     2       0       0       0       -9      A A     A A     G G
DOR     3       0       0       0       -9      A A     A A     A A
DOR     4       0       0       0       -9      A A     A A     G G
DOR     5       0       0       0       -9      A A     A A     G G
DOR     6       0       0       0       -9      A A     A A     A G

 

出现如下警告:

 

 

003、设定染色体的情况

root@PC1:/home/test# ls
outcome.map  outcome.ped
root@PC1:/home/test# plink --file outcome --chr-set 40 --maf 0.01 --recode tab --out test &>/dev/null; rm *.log *.nosex
root@PC1:/home/test# ls        ## 过滤结果, test*文件
outcome.map  outcome.ped  test.map  test.ped
root@PC1:/home/test# cat test.map    ## 当指定染色体时, maf参数起作用
24      snp2    0       363750
root@PC1:/home/test# cat test.ped
DOR     1       0       0       0       -9      A G
DOR     2       0       0       0       -9      G G
DOR     3       0       0       0       -9      A A
DOR     4       0       0       0       -9      G G
DOR     5       0       0       0       -9      G G
DOR     6       0       0       0       -9      A G

 

001、可能原因时plink将24号染色体作为了Y染色体

002、在过滤包含24号染色体的数据时, 应注意避免设置染色体。 

 

补充:利用绵羊芯片数据测试

root@PC1:/home/test# ls
sheep.map  sheep.ped
root@PC1:/home/test# cut -f 1 sheep.map |uniq -c   ## 查看当前数据的染色体, 包含24号
    998 20
    768 21
    984 22
   1005 23
    662 24
    892 25
    805 26                   ## 在不加染色体信息情况下过滤
root@PC1:/home/test# plink --file sheep --maf 0.01 --recode --out test &> /dev/null; rm *.log *.nosex
root@PC1:/home/test# ls        ## 过滤结果, test文件
sheep.map  sheep.ped  test.map  test.ped    ## 指定染色体(--sheep), 然后计算24号基因频率
root@PC1:/home/test# plink --file test --sheep --freq --chr 24 --out verify &> /dev/null; rm *.log *.nosex
root@PC1:/home/test# ls
sheep.map  sheep.ped  test.map  test.ped  verify.frq
root@PC1:/home/test# head verify.frq  ## 查看基因频率结果文件, 发现有基因频率为0的, 说明第一步的maf参数并没有对24号染色体起作用
 CHR                 SNP   A1   A2          MAF  NCHROBS
  24            s75016.1    0    C            0      880
  24            s72739.1    G    A        0.217      880
  24            s29575.1    A    G       0.4852      880
  24            s23759.1    0    C            0      880
  24      OAR24_862318.1    G    A       0.2716      880
  24            s01400.1    A    T       0.1284      880
  24      OAR24_885120.1    T    A       0.2568      880
  24            s65907.1    C    A       0.4989      880
  24            s56532.1    A    G       0.4818      880

 

001、因此,在使用maf过滤染色体包含24的数据时,应当指定染色体数目 

 

posted @ 2022-09-08 08:40  小鲨鱼2018  阅读(458)  评论(0)    收藏  举报