wangchuang2017

15675871637 WeChat wangchuang2022 QQ 2545804152 wangchuang2017@hunnu.edu.cn

生物信息学的打怪升级—初段小白必备

生物信息学的打怪升级—初段小白必备

 
 

写在前面
生物信息学是什么?
Bio + informatics=Bioinformatics

生物信息学(Bioinformatics)是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学(Genomics)和蛋白质组学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。

作为一门跨学科的科学领域,生物信息学将计算机科学,统计学,数学和工程学结合起来,分析和解释生物学数据。生信未来整体前景非常好,需求超过了供给。对于做烦实验的科研人员来说,生信能够给你的更多,并且能够使你迅速转到进展更快的研究上,就算以后不走学术研究,计算技能也是高度可转移的,并且是终生受益的。虽然现在还没有很系统的教材和资料,不过你不妨从这篇入手开始或者重振生信之路。

这里转载和整理了博耘生物老师的博客,快来看看你在初段的哪一级别吧!


对于一个初学者或者已经入门的
如何来确定自己的方向
首先是从事或者学习生物信息要经历的几个阶段的划分:
∞ 初级,菜鸟,入门
∞ 初中级,数据处理员,执行员,操作员
∞ 中级,讲师,助理研究员
∞ 初高级,学者,老师,副研究员
∞ 高级,研究员,大师,学家

再次是职业发展方向的划分,存在哪些生态位:
ʚ 生物信息实习生
ʚ 生物信息学分析人员
ʚ 生物信息学工程师
ʚ 生物信息学研究主管
ʚ 生物信息学研究员

01
初级

生命科学的重点已由实验分析和数据积累
开始向数据分析及其指导下的实验验证转移
生命科学正在经历着从分析还原思维到系统整合思维的转变

正是因为这样的转变,
生物信息初级阶段
已经成为分子生物学的相关的专业的一个普遍要求,会查找和利用数据资源,会对数据进行基本的分析,或许你的方向不同,所要求你掌握的重点也不同
如果刚刚开始,下面的提纲,可以供你参考,
这是来自于实践的,而不是某种教学大纲。
生物学背景

Ø 熟悉核酸、蛋白质、RNA、中心法则等遗传学的相关概念,原理;

Ø 熟悉基因、基因组、基因组计划,测序方法、遗传图谱、物理图谱等相关知识;

Ø 了解基本的实验流程,比如PCR、凝胶电泳、文库、基因克隆、RC-PCR、x杂交、芯片等基因工程方面的实验的原理、流程;

Ø 专业英文基础

计算机背景

Ø 了解基础的网络知识,网络使用方法,如用Google进行搜索;

Ø 了解操作系统,会软件的安装与卸载;

Ø 了解基本的文件类型,比如什么是文本文件,会使用不同的程序打开相同的文件;

生物信息学

Ø 熟悉NCBI、EBI、DDBJ等网站的数据库,会熟练对核酸、蛋白质数据库进行检索,并对检索结果按照指定格式进行批量下载;

Ø 熟悉常用的数据格式,比如FASTA,Genbank,Swissprot,aln等,并会使用文本编辑器查看、编辑这些文件;

Ø 会使用网络版的BLAST、Cluster等软件的基本功能,会简单的结果分析;
会对测序结果进行处理比如去除载体,序列核对,鉴定等,了解峰图的含义;

Ø 会DNAMAN、Primer5、MEG、BioEidt等软件的安装与使用;

你可以做什么了
Ø 了解基因组研究进展,为实验设计做前期的调研,分析准备工作;

Ø 测序结果的分析,得出结论;

示例
Ø 基因的clone与鉴定,比如通过16s RNA序列鉴定新物种;

参考书目
Ø 《基因组》
Ø 《生物信息》


02
初中级

这个级别可以根据自己的发展方向、兴趣爱好
选择侧重点,可以选择偏向生物方面的对于生物统计、生物化学、物理化学等学科深入学习
方向侧重于算法研究方面;另一方面可以侧重计算方面,对于linux操作系统、数据库、perl、java、web技术等深入进行学习
当然这两个方向又是互补的
不是仅仅选择一个就可以了
生物学方面

Ø 系统生物学方面,对于物种演化等有深入的理解;

Ø 对于组学,比如基因组、蛋白组、代谢组、表达谱等等的理解;

Ø 对于线性代数、生物统计等的深入学习;

Ø 对于蛋白质的二级、三级结构,核酸的结构、物理化学性质进行深入的学习;

Ø 专业英文的学习,多看外文资料

计算机方面

Ø linux操作系统的熟悉,系统的安装、环境的配置,软件的编译安装,涉及到操作系统,要学习的地方就有很多。

Ø perl的学习;

Ø Java、C++的学习;

Ø 数据库比如mysql的初步了解,安装,建表,简单的查询;

Ø Apache的了解

生物信息学方面

Ø 学习一些算法,Blast、Cluster等比对如何实现的;

Ø Blast的本地化,可以进行库对库的比对,并可以对结果进行处理;

Ø 了解常用的软件,并能根据操作手册进行安装使用,并能说明你为什么要用这个软件;

Ø 了解NCBI上的各个数据库,会使用BLAST的高级功能,会使用seqin提交数据;

Ø 会使用bioperl,进行数据格式的转变等

你可以做什么了
画系统树,可以得到专家的认可。

参考书目
Ø 《生物化学》
Ø 《生物信息》

03
初高级

这个级别的特点体现在创新
新的算法,得到新的结论
新的流程,提高了效率
新的界面,提高了可用性
新的平台,促进了数据的交流与共享
各种表达谱数据处理
系统生物学方面
算法开发方面

综合分析平台的建立
蛋白质组方面
功能基因组方面
没有列到的其他方面

0301

综合分析平台的建立

Ø 复杂数据库的设计;
Ø 并行集群的使用;
Ø 海量数据的存储与检索;

0302
各种表达谱数据的处理
Ø 更加易用的软件的开发,多种处理方法的集合


0303
蛋白质组方面
Ø 符合规范共享系统的建立

0304
功能基因组方面
Ø 基因预测的精度
Ø 比较基因组

参考资料
基本没有什么书可以参考,要靠你出书了。

科研路其修远兮,吾将上下而求索。有烦恼苦闷或者有趣好玩的事情记得告诉小助理,希望陪伴您一起成长。

踌躇满志无限期
扬帆起航正当时
科研小助理为您在线解答

posted on 2024-01-20 09:28  王闯wangchuang2017  阅读(72)  评论(0)    收藏  举报

导航