计算之道

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

首先应该注意区分序列相似性与序列同源性的关系,序列相似不一定同源,但是判定同源性关系的时候有些算法(Maximum likelihood除外)要考虑到序列相似性。序列相似性是将待研究序列与DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找出与此序列相似的已知序列是什么,完成这一工作只需要用到两两序列比较算法,常用的程序包有BLAST,FASTA等。同源性分析是将待研究序列加入到一组与之同源,但是来自不同物种的序列中进行多序列比对,以确定该序列与其它序列间的同源性大小。多序列比较算法常用的程序包有CLUSTAL等。

1、  序列比对,从数据库中寻找相似序列: 首先打开NCBI的BLAST网站:https://blast.ncbi.nlm.nih.gov/Blast.cgi ,选择protein blast,然后将待比对序列粘贴进去,进行BLAST(一些参数的设置收藏夹或百度)。等待一定时间后将会出现与所选数据库的比对结果,按照打分高低将top100(可以设置成其他数值)的序列显示出来,然后可以将该100条序列下载下来。存成test.fasta文件。这个文件就是在mega中进行多序列比对建树所用的文件。

2、  多序列比对:打开mega,ALIGN-BUILDALIGNMENT-Create a new alignment-protein-open-retrieve sequences from file-no -test.fasta(或者直接拖动进去,或者双击打开test.fasta),然后点击Alignment——Align by ClustalW——OK——OK。然后比对成功,选择Data——Export Alignment——MEGA format保存文件为test.meg,可以关闭Align会话框。

3、  构建进化树:打开test.meg。点击PHYLOGENY——选择最上面的ML方法,参数可以选择默认参数。就出现了进化树。当然一些参数最好还是用到,比如说可信度验证的次数设置最好要大于等于500次。

4、  进化树的美化与理解

http://www.360doc.com/content/14/0617/22/17553313_387599563.shtml

https://www.sohu.com/a/196872269_675868

 

posted on 2019-07-12 22:18  计算之道  阅读(16613)  评论(0编辑  收藏  举报