亚群注释

为什么要进行亚群注释呢?

答:了解每个claster的细胞类型。

亚群注释的三种方法?

答:

  1. 找到每个claster的marker基因;自己找 FindMaekers()
  2. 找到每个claster的保守的marker基因;FindConservedMarkers()
  3. 根据已知细胞类型的marker基因,去找每个claster的marker基因。气泡图DotPlot(scRNA_harmony,feature=c("marker基因 "))

表达基因的寻找?

FindAllMarkers()函数

pct1和pct2

答:pct是percent百分比的简称,pct1表示APOC1在0 cluster的表达占比,假设0 cluster有1000个细胞,那么当pst1=0.788,则说明,0 cluster中有788个细胞有APOC1这个基因。若pct2=0.2156,则pct2表示除了0 cluster意外,其他cluster中APOC1基因的表达占比是0.216

1693402295086.png 什么是上调基因,什么是下调基因?

答:

特定类群的标志基因?

答:

气泡图的理解?

答:

颜色的深浅表示的是平均的表达度;

气泡的大小表示的是该基因在cluster内的表达百分比。

亚群注释软件

1. SingR

流程:

  1. 加载refRdata,赋值给refdata;

  2. 加载normalize之后的scRNA_harmony数据的data数据,赋值给testdata(其数据类型是稀疏矩阵dgcMatrix)

  3. 加载scRNA_harmony数据的Cluster信息;

  4. 使用SingleR进行亚群标注,其中method要选择cluster,assay.type.test数据的类型选择logcounts类型;

  5. scRNA_harmony的meta.data里面是原始数据。将SingR的注释写入meta.data中

  6. python使用annodata数据比较多;

  7. 关于cluster注释的评价方法:

    1. 基于细胞得分的注释效果评价:使用plotScoreHeatMap()可视化(横轴是labels,纵轴也是labels)查看。颜色越黄,代表cluster的注释越准确。

    1693451517292.png 0. 基于小提琴图; 0. 基于marker基因可视化展示;

2.Garnett软件进行亚群注释

  1. Garnett使用人工定义的marker基因信息来选择细胞,然后再基于这些细胞,使用弹性网络回归的机器学习算法训练分类器,得到新的marker基因,最后再利用现存的marker基因和学习到的marker基因,共同对cluster进行注释。

  2. Garnett制作训练分类器的流程:

    1. 制作符合Garnett格式的marker基因文件(marker file);
    2. 使用单细胞数据创建monocle3的CDS数据对象(cds object);
    3. 将marker file和cds object 输入到garnett中,对marker基因打分,根据评分优化marker file的信息;
    4. 然后再使用优化后的marker file和cds object 输入到Garnett分类器中,进行细胞分类;

    1693470061097.png

  3. marker file格式:

    1. 细胞类型字段以“>”号开头;
    2. 以"expressed:“开头的字段,代表了该细胞的marker基因
  4. pbmc是什么?

    答:

  5. cds对象是什么?

    答:

1693470485467.png

posted @ 2023-08-31 21:39  wuhaoliu  阅读(39)  评论(0)    收藏  举报  来源