D04 ARACNe-AP和Viper算法、R语言画图
D04 ARACNe-AP和Viper算法、R语言画图
single-cell-rcc-pipeline
-
经典的共表达网络的构建和分析:
- 第一步:基于每对基因间的相关性或相互信息定义每2个基因之间的个体关系。衡量相关性的方法有:皮尔逊相关系数、斯皮尔曼相关系数。最小绝对误差回归和贝叶斯方法也可以用来构建共表达网络。
- 共表达网络中,结点代表着不同的基因、边代表着相关性的强弱;
- 使用聚类方法鉴定共表达基因组(也就是给相关性强的基因分到同一组)
-
共表达网络的分析,在疾病或生物功能中起重要作用的基因的发现上,能起到重要作用。
-
转录调控网络:转录因子和靶基因之间的相关性网络;
-
基因调控网络:
ARACNe输入文件格式:
- 输入1是基因表达矩阵:行是基因名,列是细胞;
- 输入2是转录因子tfs(Transciption Factor);
- 同时需要些脚本;
什么是转录因子?
答
使用的是第五节课代码
source()是用来加载R代码的函数;
Idents()函数是?
答:
pheatmap绘图使用的是normalized—scaled的矩阵;
箱线图、小提琴图、气泡图使用的是normalized后的数据矩阵;
什么是10X测序的原始数据文件?
答: barcodes.tsv;genes.tsv;matrix.mtx这三样
什么是细胞亚群?
答:
单细胞测序的表达矩阵是什么?
答:行名为基因名,列名为样本名的表达矩阵。
单细胞测序最后得到的数据到底是什么?
答:单细胞测序最后得到的是一个“表达矩阵”。
单细胞分析,分析的是什么内容?
答:单细胞分析,是指对表达矩阵的内容进行分析。
EnsambleID是什么?
genename是什么?
EnsambleID全部改为genename
pbmc-r1-clusters-cluster-1-metaCells.csv文件展示的是每个基因所对应的蛋白活性,列是barcode名,行是基因名。
viper算法可以得到RDS类型的文件
r1.pAct是蛋白活性表达矩阵;
Viper算法流程 :
java脚本处理单细胞原始测序数据-->得tsv格式数据-->RegProcess函数处理tsv数据-->得rds格式数据-->viper函数处理rds数据,生成蛋白活性表达矩阵(pACt)。
然后就是降维聚类-->UMAP可视化

浙公网安备 33010602011771号