linux 中shell脚本实现将fasta文件中每一条scaffold中的碱基转换为一行

 

001、

[root@PC1 test]# ls
a.fa
[root@PC1 test]# cat a.fa                  ## 测试fasta文件
>chr1
AACCCTTG
TTCCCCC
>chr2
CCCTTTTT
CCCCCCCC
TTTT
>chr3
TTTTCCCC
GGGG
[root@PC1 test]# awk '{if(NR == 1) {print $0} else if($0 !~ />/) {printf("%s", $0)} else {printf("\n"); print $0}} END {printf("\n")}' a.fa   ## 将每条scaffold的碱基转换为1行
>chr1
AACCCTTGTTCCCCC
>chr2
CCCTTTTTCCCCCCCCTTTT
>chr3
TTTTCCCCGGGG
[root@PC1 test]# awk '{if(NR == 1) {print $0} else if($0 !~ />/) {printf("%s", $0)} else {printf("\n"); print $0}} END {printf("\n")}' a.fa | cat -A
>chr1$
AACCCTTGTTCCCCC$
>chr2$
CCCTTTTTCCCCCCCCTTTT$
>chr3$
TTTTCCCCGGGG$

 

posted @ 2023-01-10 22:36  小鲨鱼2018  阅读(77)  评论(0)    收藏  举报