salmon快速基因和转录本定量 | isoform

参考前篇:可变剪切 | isoform | PSI | 单细胞 | suppa | salmon

salmon的定量是不基于序列比对的

Salmon基因定量是一种常用于RNA测序(RNA-seq)数据分析的方法,其原理是利用贝叶斯统计模型从RNA-seq reads中预测不同转录本或基因的表达量。 相比传统的基于比对的方法,它可以更准确地识别和量化转录本,并且能够更好地处理多样性的剪切形式。

 

我的目的有两个:

  1. 基因水平的快速定量
  2. 转录本/exon水平的快速定量

 

安装

conda search salmon -c bioconda
conda install -c bioconda salmon=1.10.2

 

conda  create --name RNAseq -c bioconda salmon=1.10.2

  

提取cellranger transcript,构建索引

conda install -c bioconda gffread
gffread -w cellranger.GRCh38.transcripts.fasta -g genome.fa genes.gtf
salmon index -t cellranger.GRCh38.transcripts.fasta -i cellranger.GRCh38.salmon.index

 

定量

#!/bin/bash
source /etc/profile
#$ -S /bin/bash
#$ -pe pvm 2
#$ -cwd
#$ -N RNAseq

export PATH=/home/zz950/softwares/self_bin:$PATH
source /home/zz950/softwares/miniconda3/bin/activate /home/zz950/softwares/miniconda3/envs/RNAseq

SampleCSV=all.samples.csv
index=/home/zz950/reference/salmon/cellranger.mm10.salmon.index
gtf=/home/zz950/reference/salmon/genes.gtf

cpu=12

# ######################### main loop #############################
cat $SampleCSV | while IFS="," read sample fq1 fq2; do
###################################################################
salmon quant -i $index -l IU -1 $fq1 -2 $fq2 --validateMappings --gcBias --seqBias -g $gtf -o results/$sample

done

echo "all done"

 

在R中合并table

参考:http://localhost:17435/notebooks/projects/bulk_NGS/RNA_seq/Cdx2_organoid_RA_RNA-seq/results/RNA-seq-count.ipynb 

  

 

 

参考:

 

posted @ 2023-09-02 07:32  Life·Intelligence  阅读(190)  评论(0编辑  收藏  举报
TOP