2026-1-18 humann工作流总结

环境的搭建和激活

conda create --name biobakery3 python=3.7
conda activate biobakery3

设置conda的环境

conda config --add channels defaults
conda config --add channels bioconda
conda config --add channels conda-forge
conda config --add channels biobakery

安装HUMAnN3的软件的demo数据库（用于测试软件）

conda install humann -c biobakery

检测软件是否安装成功

这部分软件我并未成功安装，数据库下载之后始终没有和软件相匹配，因而上部分的内容就权且用于参考吧。但总而言之，humann的安装首先要安装数据库和metaphlan4的软件

查看软件的版本

conda activate humann4
humann --version

软件运行（运行一下demo文件试试）

humann --input $SAMPLE --output $OUTPUT_DIR

# $SAMPLE这放入输入文件的路径和文件名”，而$OUTPUT_DIR放入创建的输出目录的路径”

下面是不同格式文件的输入方式（输入的文件是demo.不同格式的话）

humann --input examples/demo.fasta --output $OUTPUT_DIR
humann --input examples/demo.fastq --output $OUTPUT_DIR
humann --input examples/demo.sam --output $OUTPUT_DIR
humann --input examples/demo.m8 --output $OUTPUT_DIR

workflow

1.输入文件

#存放在 $INPUT_DIR 目录下的每一个过滤好的 fastq 样本文件，逐一运行 HUMAnN 软件进行分析，并把所有生成的结果文件都保存到 $OUTPUT_DIR 目录里，针对INPUT_DIR路径下的$SAMPLE.fastq文件进行分析

humann --input $SAMPLE.fastq --output $OUTPUT_DIR

#文件为$SAMPLE_2_GENEFAMILIES.TSV和$SAMPLE_4_PATHABUNDANCE.TSV

2.对丰度输出文件进行标准化处理（如针对SAMPLE_2_genefamilies.tsv文件）

humann_renorm_table --input $SAMPLE_2_genefamilies.tsv --output $SAMPLE_2_genefamilies_relab.tsv --units relab

3. 将所有样本的 HUMAnN 运行结果中的输出文件（基因家族和丰度）合并为三个文件（但官方文档只提了前两种，输出的结果文件分别为humann_2_genefamilies.tsv和humann_4_pathabundance.tsv）

## 3.1 合并基因家族文件
humann_join_tables --input $OUTPUT_DIR --output $OUTPUT_DIR/genefamilies.tsv --file_name 2_genefamilies_relab.tsv
## 3.2 合并丰度文件
humann_join_tables --input $OUTPUT_DIR --output $OUTPUT_DIR/pathabundance.tsv --file_name 4_pathabundance.tsv
## 3.3 合并其他文件（如SAMPLE_3_genefamilies.tsv）
humann_join_tables --input $OUTPUT_DIR --output $OUTPUT_DIR/other.tsv --file_name 3_genefamilies.tsv

posted @ 2026-01-18 09:51 LyuHongyi 阅读(4) 评论(0) 收藏举报

刷新页面返回顶部

Technology changes the world.

Scholars Need a Blog

2026-1-18 humann工作流总结

环境的搭建和激活

设置conda的环境

安装HUMAnN3的软件的demo数据库（用于测试软件）

检测软件是否安装成功

查看软件的版本

软件运行（运行一下demo文件试试）

下面是不同格式文件的输入方式（输入的文件是demo.不同格式的话）

workflow

1.输入文件

2.对丰度输出文件进行标准化处理（如针对SAMPLE_2_genefamilies.tsv文件）

3. 将所有样本的 HUMAnN 运行结果中的输出文件（基因家族和丰度）合并为三个文件（但官方文档只提了前两种，输出的结果文件分别为humann_2_genefamilies.tsv和humann_4_pathabundance.tsv）

公告