摘要: 实际数据分析中遇到需求,把某个Excel表格按照某一列分为多个sheet,并且要求如果某个key对应的行数较少应该合并到一个sheet中。 ```Python import pandas as pd import bioquest as bq # https://jihulab.com/BioQue 阅读全文
posted @ 2023-05-27 09:11 生信探索 阅读(183) 评论(0) 推荐(0)
摘要: <~生~信~交~流~与~合~作~请~关~注~公~众~号@生信探索> 学习的第一个GATK找变异流程,人的种系变异的短序列变异,包括SNP和INDEL。写了一个SnakeMake分析流程,从fastq文件到最后的vep注释后的VCF文件,关于VCF的介绍可以参考上一篇推文基因序列变异信息VCF (Va 阅读全文
posted @ 2023-05-27 09:10 生信探索 阅读(110) 评论(0) 推荐(0)
摘要: 写的数据预处理snakemake流程其实包括在每个单独的分析中比如种系遗传变异和肿瘤变异流程中,这里单独拿出来做演示用,因为数据预处理是通用的,在call变异之前需要处理好数据。 数据预处理过程包括,从fastq文件去接头、比对到基因组、去除重复、碱基质量校正,最后得到处理好的BAM或CRAM文件。 阅读全文
posted @ 2023-05-27 09:09 生信探索 阅读(81) 评论(0) 推荐(0)
摘要: ![生信交流与合作请关注公众号@生信探索] 摘要 CD39可能作为膀胱癌(BC)潜在治疗靶点。抑制CD39能够抑制肿瘤生长和延长生存时间。通过单细胞测序发现CD39抑制介导了肿瘤微环境的改变。 背景 CD39是膜外三磷酸腺苷二磷酸水解酶-1,由ENTPD1编码。 功能:CD39与胞外ATP(extr 阅读全文
posted @ 2023-02-17 09:05 生信探索 阅读(225) 评论(0) 推荐(0)
摘要: 需求:写一个多网页的网站,包括header、footer、菜单包括主页home、博客blog(外部链接到博客)、about(自我介绍页面) home页面包括一个旋转木马(几张图片循环播放)、再下边单个APP点击后进入可以分析)。 其中第一个APP是shiny APP,用外部网址链接到shiny网站, 阅读全文
posted @ 2023-02-13 19:59 生信探索 阅读(358) 评论(0) 推荐(0)
摘要: 前言 27K的数据是很老的芯片数据,但是客户有需求就要找方法分析,主流的DNA甲基化芯片R包minfi和champ都只支持450K和850K的芯片。所以在bioconductor中搜索到了methylumi这个包,可以从idat读数据,经过质控得到beta值矩阵,之后用limma做差异分析。 可以参 阅读全文
posted @ 2023-02-09 22:07 生信探索 阅读(282) 评论(0) 推荐(0)
摘要: 背景 Merkel cell carcinoma:梅克尔细胞癌又名皮肤小梁状癌、原发性皮肤神经内分泌癌、皮肤原发性小细胞癌及皮肤APUD瘤。 HLA:MHC基因产物在不同细胞表面表达,通常称之为MHC分子或主要组织相容性抗原,对抗原递呈和免疫信号传递起关键作用。人的MHC又叫HLA。 HLA抗原根据 阅读全文
posted @ 2023-02-06 21:20 生信探索 阅读(128) 评论(0) 推荐(0)
摘要: ROC(全称为Receiver operating characteristic,意为受试者特征曲线)是一个二维平面空间中一条曲线,而AUC则是曲线下方面积(Area Under Curve)的计算结果,是一个具体的值 x轴是FPR,y轴是TPR,曲线上的每个点就对应着一组(FPR,TPR)坐标,所 阅读全文
posted @ 2022-11-26 20:08 生信探索 阅读(245) 评论(0) 推荐(0)