摘要: 主流的研究模型(按高大上和难易程度排名): 斑马鱼 Zebrafish 细胞系 cell line 小鼠模型 mouse in vivo model 干细胞(病人来源)模型 (patient) iPSC-based model 类器官 organoid model 病人组织 primary cell 阅读全文
posted @ 2022-02-13 16:55 Life·Intelligence 阅读(525) 评论(0) 推荐(0) 编辑
摘要: 都有哪些玩家? 某个生物学方向(发育、免疫、癌症)的大佬,强在领域的深耕,先进的技术平台,能产生高质量的data,第一作者和通讯一般都是搞实验的,生信最多也就是个共一,文章容易冲击CNS。【掌握实验材料、临床样本、测序数据】 某个疾病(depression、SLE、HSCR)的遗传学家,主要就是借助 阅读全文
posted @ 2021-05-19 15:06 Life·Intelligence 阅读(816) 评论(0) 推荐(0) 编辑
摘要: 持续添加~ 基因组学 2020 - NRG - The road ahead in genetics and genomics 2019 - NRG - RNA sequencing: the teenage years 【中文导读】 2021 - Nature - Closing in on a 阅读全文
posted @ 2021-05-13 19:47 Life·Intelligence 阅读(445) 评论(0) 推荐(0) 编辑
摘要: 2022年03月01日 HSCR文章的一些科普 progenitor和precursor的区别 The main difference between progenitor and precursor cells is that progenitor cells are mainly multipo 阅读全文
posted @ 2021-03-10 16:24 Life·Intelligence 阅读(635) 评论(0) 推荐(1) 编辑
摘要: 2022年09月01日 现在基本的图形已经得心应手了。 问题是如何配色,使图形更加fancy,组合图如何美观统一。【向CNS靠齐,最少也要以CNS子刊的标准来出图】 参考: 要想文章好,图片少不了,22个技能助您获得美图(带字幕视频) - AI教程 【字体线条一旦不统一,出图将会非常丑】 我的私人库 阅读全文
posted @ 2021-02-04 18:41 Life·Intelligence 阅读(1253) 评论(0) 推荐(0) 编辑
摘要: 一些经验【走过的弯路】 gzip速度极慢,甚至比处理数据本身要慢得多!!! - 没人会经常压缩和解压文件,压缩的原始文件最好永远不要动。运行的中间文件用完即删,这个时代,存储空间比计算资源贵得多。 FileZilla传输(上传或下载)文件过程中,文件大小会变化 - 改设置,参考文章。 tar命令分别 阅读全文
posted @ 2021-01-12 23:10 Life·Intelligence 阅读(391) 评论(0) 推荐(0) 编辑
摘要: 像fastq这样的原始文件是肯定不能丢掉的,必须保存在硬盘里或者放到ftp服务器上,以便之后再度调取分析。 fastq保存时问题不大,但因为文件巨大,传输通常需要几小时-几天,非常容易在传输过程中损毁,这时候我们就需要一种方法来检验我们下载的fastq(任何其他原始文件)是否完整。 MD5信息摘要算 阅读全文
posted @ 2022-09-07 16:49 Life·Intelligence 阅读(34) 评论(0) 推荐(0) 编辑
摘要: 10x是最成功的单细胞公司,目前最成功的商业平台,已经有很多成熟的单细胞产品线,不管是新手还是进阶的高手都在玩他们平台产生的数据。 这里试图对10x的核心技术和数据来做一个剖析,试图理解其核心原理,加速数据分析进程,辅助科研发现。 我目前玩过的10x数据: scRNA-seq (antibody h 阅读全文
posted @ 2022-08-23 18:23 Life·Intelligence 阅读(32) 评论(0) 推荐(0) 编辑
摘要: 这个要严谨一点,众所周知,小鼠是小写,人是大写,以前为了方便都是直接一个toupper函数完成转换,但这样做实在是太粗糙了,大概有三分之一的基因会丢失。 我简单统计了一下: 人鼠同源的有23242个基因注释,其中有7695个基因是无法简单对应的,所以你之前的分析会漏掉很多基因。 建议使用ensemb 阅读全文
posted @ 2022-08-19 13:38 Life·Intelligence 阅读(31) 评论(0) 推荐(0) 编辑
摘要: 历史分析: pathway是一个不得不研究的主体,比如我们的paper就给很多GO pathway的基因打分了,很简单就是一个求均值。 关于complex的活性打分,就得使用几何平均,因为缺失任何一个都会导致complex失活。 现有工具: AUCell allows to identify cel 阅读全文
posted @ 2022-08-18 23:21 Life·Intelligence 阅读(16) 评论(0) 推荐(0) 编辑
摘要: 搜索历史文件真的是最基本的需求,听说everything是个好东西,但Mac平台自带的splotlight search已经足够好用,直达文件。 Linux我则不太会搜索,find命令有点复杂,最近无意搜索Linux平台是否有类似everything的工具,还真发现了一个非常活跃的fzf工具,非常好 阅读全文
posted @ 2022-08-11 11:10 Life·Intelligence 阅读(20) 评论(0) 推荐(0) 编辑
摘要: 好久没有继续我的学习/写作/科普大业了,这个positive feedback loop是非常powerful的。 这一期的主题,Apc - Wnt - CRC 这也是我今后的研究主题。 先抛出问题: Wnt pathway的组成成分有哪些,都控制了哪些重要的细胞功能? 正常情况下,Apc是如何与W 阅读全文
posted @ 2022-08-05 18:55 Life·Intelligence 阅读(73) 评论(0) 推荐(1) 编辑
摘要: 终于要开始分析scATAC-seq数据了,联合scRNA-seq就可以做multi-omics,可以深入挖掘TF的调控机制。 先从seurat和signac开始上手 cellRanger - Understanding Output 10x - ATAC Data Concepts 10x - Ce 阅读全文
posted @ 2022-08-03 13:19 Life·Intelligence 阅读(93) 评论(0) 推荐(0) 编辑
摘要: 理解单细胞数据的本质,一个matrix,以及行与列的annotation。 一个最不友好的格式就是loom,只能用python来读取,存储为CSV。 project/scPipeline/public/Linnarsson_2020_developing_mouse_brain/getData_fr 阅读全文
posted @ 2022-07-25 23:55 Life·Intelligence 阅读(61) 评论(0) 推荐(0) 编辑
摘要: 大型Cancer数据库 TCGA ICGC 目前已知的oncogene 什么是oncogene?跟其在癌症中的表达量无关,而是作用,主动去激发cancer的gene才算,这些基因正常情况下都是有自己作用的(proto-oncogene),被mutated/over-expressed之后才变为onc 阅读全文
posted @ 2022-07-19 17:34 Life·Intelligence 阅读(79) 评论(0) 推荐(0) 编辑
摘要: 英语真的不太行,阅读和写作没问题,听力和口语则严重拉胯。 表现在科研presentation上,则是汇报讲述时,水平一流;一旦被提问,则变成哑巴;最糟糕的,一旦聊起生活,更像个弱智,最简单的日常用语都不会表达。 我最终的目的: 日常能与人顺利交谈; 能做到接近完美的学术汇报; Native spea 阅读全文
posted @ 2022-07-15 15:27 Life·Intelligence 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 2022 - CMGH - A Proximal-to-Distal Survey of Healthy Adult Human Small Intestine and Colon Epithelium by Single-Cell Transcriptomics 2018 - GB - Cell 阅读全文
posted @ 2022-07-12 20:39 Life·Intelligence 阅读(21) 评论(0) 推荐(0) 编辑
摘要: 最近听了一下华大王崇志老师讲多组学分析【科技君-BGITech】,印象很深刻,很多方法论的东西觉得很有意思,没有吃透,这里再花时间好好整理一下。 华大人思想还是很深刻的,但做研究就容易过于肤浅,还是需要好好设计实验,产生好的数据才能做好分析。 为什么要搞多组学?大一统的野心 为什么生物医学大家都在玩 阅读全文
posted @ 2022-06-02 12:10 Life·Intelligence 阅读(371) 评论(0) 推荐(1) 编辑
摘要: heart single-cell dataset Single-cell transcriptomic landscape of cardiac neural crest cell derivatives during development https://www.ncbi.nlm.nih.go 阅读全文
posted @ 2022-04-22 18:55 Life·Intelligence 阅读(118) 评论(0) 推荐(0) 编辑
摘要: 做生信的最终梦想,就是自己开发一款热度极高的R包,在历史上留下一笔。 之前的开发经验非常重要:https://github.com/leezx/Toolsets Bioconductor Packages: Development, Maintenance, and Peer Review - 总教 阅读全文
posted @ 2022-04-07 13:37 Life·Intelligence 阅读(115) 评论(0) 推荐(0) 编辑
摘要: 因为没有在这一行真正干过,所以一些基本概念还不是很明确,这里作一个梳理。 看本领域的遗传学综述有感:The Emerging Genetic Landscape of Hirschsprung Disease and Its Potential Clinical Applications 问题: 什 阅读全文
posted @ 2022-03-16 23:03 Life·Intelligence 阅读(210) 评论(0) 推荐(0) 编辑
摘要: 问题: Trios分析的基本原理和假设 Trios分析应用的场景? Trios与其他方法相比的优缺点 Trios研究的经典案例 Trios分析的基本原理和假设 从医院的病例开始,我们收集了一些特病表型的病人,不知道致病原因pathogenesis,有可能是遗传病genetic,也有可能是外在因素导致 阅读全文
posted @ 2022-03-16 21:27 Life·Intelligence 阅读(460) 评论(0) 推荐(0) 编辑
摘要: 重点关注基础医学的实验设计:GWAS、疾病的分子机理的研究。 只有reference我们能做什么? 以human genome为例,基本的注释、功能、互作都能做,以此为蓝图是可以重构一个human的,但这只是一个人的维度,为了维持多样性,我们必须引入各种突变,然后筛选适者; 理论上,我们可以借助控制 阅读全文
posted @ 2022-03-15 14:12 Life·Intelligence 阅读(178) 评论(0) 推荐(0) 编辑
摘要: 以后,随着自己课题组建立起来,数据不断积累,良好的管理系统就必不可少了。 关键点: 测序raw data的存储与初步分析 下游分析processed data的存储与分析 数据的深入解读和分析 数据的统一注释 google:multi omics data management platform 有 阅读全文
posted @ 2022-03-15 12:23 Life·Intelligence 阅读(133) 评论(0) 推荐(0) 编辑
摘要: 这项技术太重要了,做细胞发育的单细胞的不得不用。主要用途就是marking 表达过特定基因的子代细胞,比如Sox10标记的Neural crest,或者做conditional的KO。 同类技术:基因敲除,编辑等。 基本解释: Cre-LoxP Recombination Cre是一个细菌的蛋白,可 阅读全文
posted @ 2022-03-02 19:16 Life·Intelligence 阅读(237) 评论(0) 推荐(0) 编辑
摘要: PS拼图: 设置画布大小和分辨率(17.78cm x 22.86cm,600) 现在高分的干湿结合的paper肯定是多人合作的,然后最终结果汇总到一个大佬手上开始整合写作。 版本管理问题: 高分的paper肯定是要改几个版本的,我的HSCR的paper最少大改了3次,最后回溯到倒数第二个版本 文本对 阅读全文
posted @ 2022-03-01 15:37 Life·Intelligence 阅读(123) 评论(0) 推荐(0) 编辑
TOP