摘要:不看代码直接调包就是耍流氓 主要的思路: cnv.pl.chromosome_heatmap内部核心操作: use_rep = "cnv" tmp_adata = AnnData(X=adata.obsm[f"X_{use_rep}"], obs=adata.obs) 这一步之后调用scanpy.p
阅读全文
摘要:他的出现一定有他的理由,他的离开也有他的理由 随着单细胞测序数据的增长,如果把数据全部导入内存则占用的内存太大,如何处理这个问题呢,一种思路是不一次直接将数据导入内存,一种是优化内存存储。针对这两种思路们都有相应的包。现在的格式太多了,h5ad,loom,h5seurat,这些格式有什么区别呢? 1
阅读全文
摘要:看来还得和临床结合才知道为什么提出问题 问题的背景 为什么提出PAM50分型,因为乳腺癌病人的异质性特别大,所以需要将这些病人进行一个分型,以便更好的治疗。 发展的历史 最初是根据免疫组化的三个指标进行分型的 HR+ HER2- HR+ HER2+ HR- HER2+ TNBC 随着RNA-seq的
阅读全文
摘要:library(Matrix) write(colnames(data_all), file = "Ramachandran2019_expression/baocodes.tsv",sep = "/t") write(rownames(data_all), file = "Ramachandran
阅读全文
摘要:测序数据处理了这么多,只知道怎么测序,但是不知道怎么组装,也不知道基因是怎么定位的,好奇心都不知道去哪里了 现在被大众所知道的是基因组测序,怎么测序列已经知道了,怎么定位可以从下面的几个参考文献中了解到。 参考文献: 1、http://blog.sciencenet.cn/blog-3431904-
阅读全文
摘要:对于一个生物知识还停留在初中和高中时代的人来说,理解基因组数据确实有点困难,经过几天的探索,初步对这个概念有了一些理解。下面逐一解释。 #人类有显性基因和隐性基因,可是人类基因组并没有测序怎么办 人类基因组99.9%的序列都是一样的,只有少数不一样,这一部分需要对大量人群进行统计,因此诞生了数据库d
阅读全文