如何达成生信中各种identifier的转化

背景:

生信中很重要的一个部分就是各种数据库(database),有名的比如Uniprot,String,Entrez Gene,GenBank等等。之后会整合这些数据库做个表格,指向不同格式的id分别来自哪些数据库。

这篇随笔介绍几个工具帮你从一种id(比如gene name,Uniprot id,String等)转成另一种id。

工具是具有限制的,有时候使用的数据库不够普及下,很难做到不同数据库一一对应,这时候只能重新根据sequence每个做一一对应的annotation。

  • DAVID:https://david.ncifcrf.gov/content.jsp?file=conversion.html

 

 选择栏目中的 “Start Analysis”

 

 侧边栏:

  在select Identifier里:

 

 在这里可以选择Gene list,最后选择提交。

 

这里以拟南芥的gene name为例,提交后页面刷新:

 

 这里可以选你想转化去的id,比如Uniprot,选择物种(重要),一定要清楚自己数据来源物种的准确名称。最后点 “Submit to conversion Tool”。

结果:

 

 

点convert 下的那些部分自己查看即可。因为这次输入的id选的是 “Not Sure”,所以DAVID把所有的可能都罗列了。但转换结果都是Uniprot id。最后点Download File即可下载。非常轻松。

 

 

  • Uniprot ID Mapping

因为最近在找其他 identifier转Uniprot ID,所以本篇都是关于此。

 

 进了Uniprot直接点 “Retrieve/ID mapping”。提供你的identifiers,支持文件上传。

 

 在第二步选择好从哪种名字往哪种转。再指定物种名即可。

 

 如图,最后Download里指定是想输出FASTA格式,excel格式还是其他。

 

  • Mygene.info

没用明白的一个网站。但可能有人需要所以放在这里。https://mygene.info/v3/api#/

感觉上应该是专门用于已知gene name之后的各种分析。

 

posted @ 2022-03-17 03:15  SheeryLau  阅读(297)  评论(0)    收藏  举报