摘要: 不论是WGS 还是cfDNA sequencing,call CNV的整体思路都是一样的,一般分为下面的步骤: 1. 将基因组分成相同size 的bin (non-overlap), cfDNA 数据局部coverage bias比较多,bin的size不可以太小。还存在要不要去除genome含N区 阅读全文
posted @ 2020-08-05 16:53 wangbkmark 阅读(870) 评论(0) 推荐(0)
摘要: 在评估整个dataset processing, normalization 等整个过程的procedure是否合适,出来的模型是否稳健时,由于数据量有限,可以使用cross validation 来评价。但重要的是CV只是用来评价procedure是否合适,而不是确定model和hyperpara 阅读全文
posted @ 2020-07-26 17:24 wangbkmark 阅读(283) 评论(0) 推荐(0)
摘要: RNA-seq数据分析中,为了鉴定两个group 差异表达的基因,会针对每一个基因分别做假设检验(例如T-test),这里会出来一个P-value,但是往往R中专门做差异表达的package,还会有Adjusted-P 这么一个P-value。或者我们经常会碰到FDR这个概念。这些说的都是Multi 阅读全文
posted @ 2020-07-25 17:59 wangbkmark 阅读(4838) 评论(0) 推荐(0)
摘要: 这些统计概念真的反复看了很多次,当时理解,事后就模糊了。下面两篇讲解不错 二项分布、泊松分布、正态分布 二项分布、泊松分布和正态分布的区别及联系? 阅读全文
posted @ 2020-06-30 10:43 wangbkmark 阅读(1040) 评论(0) 推荐(0)
摘要: 要全面理解cfDNA的产生过程,1. 首先需要搞清楚核小体的footprint,核小体的排布决定了哪些genome 片段能被保护下来。2. 程序性死亡(apoptosis)过程中,DNA的降解需要哪些细胞(例如macrophage),哪些酶(DFF/CAD、DNA1L3、DNASE1)参与了哪一步? 阅读全文
posted @ 2020-06-27 19:36 wangbkmark 阅读(218) 评论(0) 推荐(0)