序列相似性比较与同源性分析 - 计算之道

公告

首先应该注意区分序列相似性与序列同源性的关系，序列相似不一定同源，但是判定同源性关系的时候有些算法（Maximum likelihood除外）要考虑到序列相似性。序列相似性是将待研究序列与DNA或蛋白质序列库进行比较，用于确定该序列的生物属性，也就是找出与此序列相似的已知序列是什么，完成这一工作只需要用到两两序列比较算法，常用的程序包有BLAST，FASTA等。同源性分析是将待研究序列加入到一组与之同源，但是来自不同物种的序列中进行多序列比对，以确定该序列与其它序列间的同源性大小。多序列比较算法常用的程序包有CLUSTAL等。

1、序列比对，从数据库中寻找相似序列：首先打开NCBI的BLAST网站：https://blast.ncbi.nlm.nih.gov/Blast.cgi ，选择protein blast，然后将待比对序列粘贴进去，进行BLAST（一些参数的设置收藏夹或百度）。等待一定时间后将会出现与所选数据库的比对结果，按照打分高低将top100（可以设置成其他数值）的序列显示出来，然后可以将该100条序列下载下来。存成test.fasta文件。这个文件就是在mega中进行多序列比对建树所用的文件。

2、多序列比对：打开mega，ALIGN-BUILDALIGNMENT-Create a new alignment-protein-open-retrieve sequences from file-no -test.fasta（或者直接拖动进去，或者双击打开test.fasta）,然后点击Alignment——Align by ClustalW——OK——OK。然后比对成功，选择Data——Export Alignment——MEGA format保存文件为test.meg，可以关闭Align会话框。

3、构建进化树：打开test.meg。点击PHYLOGENY——选择最上面的ML方法，参数可以选择默认参数。就出现了进化树。当然一些参数最好还是用到，比如说可信度验证的次数设置最好要大于等于500次。

4、进化树的美化与理解

http://www.360doc.com/content/14/0617/22/17553313_387599563.shtml

https://www.sohu.com/a/196872269_675868

posted on 2019-07-12 22:18 计算之道阅读(21104) 评论(0) 收藏举报

刷新页面返回顶部