2026-1-18 humann工作流总结

环境的搭建和激活
conda create --name biobakery3 python=3.7
conda activate biobakery3
设置conda的环境
conda config --add channels defaults
conda config --add channels bioconda
conda config --add channels conda-forge
conda config --add channels biobakery
安装HUMAnN3的软件的demo数据库(用于测试软件)
conda install humann -c biobakery
检测软件是否安装成功

这部分软件我并未成功安装,数据库下载之后始终没有和软件相匹配,因而上部分的内容就权且用于参考吧。但总而言之,humann的安装首先要安装数据库和metaphlan4的软件

查看软件的版本
conda activate humann4
humann --version
软件运行(运行一下demo文件试试)
humann --input $SAMPLE --output $OUTPUT_DIR

# $SAMPLE这放入输入文件的路径和文件名”,而$OUTPUT_DIR放入创建的输出目录的路径”
下面是不同格式文件的输入方式(输入的文件是demo.不同格式的话)
humann --input examples/demo.fasta --output $OUTPUT_DIR
humann --input examples/demo.fastq --output $OUTPUT_DIR
humann --input examples/demo.sam --output $OUTPUT_DIR
humann --input examples/demo.m8 --output $OUTPUT_DIR

workflow

1.输入文件
#存放在 $INPUT_DIR 目录下的每一个过滤好的 fastq 样本文件,逐一运行 HUMAnN 软件进行分析,并把所有生成的结果文件都保存到 $OUTPUT_DIR 目录里,针对INPUT_DIR路径下的$SAMPLE.fastq文件进行分析

humann --input $SAMPLE.fastq --output $OUTPUT_DIR

#文件为$SAMPLE_2_GENEFAMILIES.TSV和$SAMPLE_4_PATHABUNDANCE.TSV
2.对丰度输出文件进行标准化处理(如针对SAMPLE_2_genefamilies.tsv文件)
humann_renorm_table --input $SAMPLE_2_genefamilies.tsv --output $SAMPLE_2_genefamilies_relab.tsv --units relab
3. 将所有样本的 HUMAnN 运行结果中的输出文件(基因家族和丰度)合并为三个文件(但官方文档只提了前两种,输出的结果文件分别为humann_2_genefamilies.tsv和humann_4_pathabundance.tsv)
## 3.1 合并基因家族文件
humann_join_tables --input $OUTPUT_DIR --output $OUTPUT_DIR/genefamilies.tsv --file_name 2_genefamilies_relab.tsv
## 3.2 合并丰度文件
humann_join_tables --input $OUTPUT_DIR --output $OUTPUT_DIR/pathabundance.tsv --file_name 4_pathabundance.tsv
## 3.3 合并其他文件(如SAMPLE_3_genefamilies.tsv)
humann_join_tables --input $OUTPUT_DIR --output $OUTPUT_DIR/other.tsv --file_name 3_genefamilies.tsv
posted @ 2026-01-18 09:51  LyuHongyi  阅读(4)  评论(0)    收藏  举报