亚群注释
为什么要进行亚群注释呢?
答:了解每个claster的细胞类型。
亚群注释的三种方法?
答:
- 找到每个claster的marker基因;自己找 FindMaekers()
- 找到每个claster的保守的marker基因;FindConservedMarkers()
- 根据已知细胞类型的marker基因,去找每个claster的marker基因。气泡图DotPlot(scRNA_harmony,feature=c("marker基因 "))
表达基因的寻找?
FindAllMarkers()函数
pct1和pct2
答:pct是percent百分比的简称,pct1表示APOC1在0 cluster的表达占比,假设0 cluster有1000个细胞,那么当pst1=0.788,则说明,0 cluster中有788个细胞有APOC1这个基因。若pct2=0.2156,则pct2表示除了0 cluster意外,其他cluster中APOC1基因的表达占比是0.216
什么是上调基因,什么是下调基因?
答:
特定类群的标志基因?
答:
气泡图的理解?
答:
颜色的深浅表示的是平均的表达度;
气泡的大小表示的是该基因在cluster内的表达百分比。
亚群注释软件
1. SingR
流程:
-
加载refRdata,赋值给refdata;
-
加载normalize之后的scRNA_harmony数据的data数据,赋值给testdata(其数据类型是稀疏矩阵dgcMatrix)
-
加载scRNA_harmony数据的Cluster信息;
-
使用SingleR进行亚群标注,其中method要选择cluster,assay.type.test数据的类型选择logcounts类型;
-
scRNA_harmony的meta.data里面是原始数据。将SingR的注释写入meta.data中
-
python使用annodata数据比较多;
-
关于cluster注释的评价方法:
- 基于细胞得分的注释效果评价:使用plotScoreHeatMap()可视化(横轴是labels,纵轴也是labels)查看。颜色越黄,代表cluster的注释越准确。
0. 基于小提琴图; 0. 基于marker基因可视化展示;
2.Garnett软件进行亚群注释
-
Garnett使用人工定义的marker基因信息来选择细胞,然后再基于这些细胞,使用弹性网络回归的机器学习算法训练分类器,得到新的marker基因,最后再利用现存的marker基因和学习到的marker基因,共同对cluster进行注释。
-
Garnett制作训练分类器的流程:
- 制作符合Garnett格式的marker基因文件(marker file);
- 使用单细胞数据创建monocle3的CDS数据对象(cds object);
- 将marker file和cds object 输入到garnett中,对marker基因打分,根据评分优化marker file的信息;
- 然后再使用优化后的marker file和cds object 输入到Garnett分类器中,进行细胞分类;
-
marker file格式:
- 细胞类型字段以“>”号开头;
- 以"expressed:“开头的字段,代表了该细胞的marker基因
-
pbmc是什么?
答:
-
cds对象是什么?
答:

浙公网安备 33010602011771号