如何达成生信中各种identifier的转化
背景:
生信中很重要的一个部分就是各种数据库(database),有名的比如Uniprot,String,Entrez Gene,GenBank等等。之后会整合这些数据库做个表格,指向不同格式的id分别来自哪些数据库。
这篇随笔介绍几个工具帮你从一种id(比如gene name,Uniprot id,String等)转成另一种id。
工具是具有限制的,有时候使用的数据库不够普及下,很难做到不同数据库一一对应,这时候只能重新根据sequence每个做一一对应的annotation。
- DAVID:https://david.ncifcrf.gov/content.jsp?file=conversion.html

选择栏目中的 “Start Analysis”
![]()
侧边栏:
在select Identifier里:
在这里可以选择Gene list,最后选择提交。
这里以拟南芥的gene name为例,提交后页面刷新:

这里可以选你想转化去的id,比如Uniprot,选择物种(重要),一定要清楚自己数据来源物种的准确名称。最后点 “Submit to conversion Tool”。
结果:


点convert 下的那些部分自己查看即可。因为这次输入的id选的是 “Not Sure”,所以DAVID把所有的可能都罗列了。但转换结果都是Uniprot id。最后点Download File即可下载。非常轻松。

- Uniprot ID Mapping
因为最近在找其他 identifier转Uniprot ID,所以本篇都是关于此。

进了Uniprot直接点 “Retrieve/ID mapping”。提供你的identifiers,支持文件上传。

在第二步选择好从哪种名字往哪种转。再指定物种名即可。

如图,最后Download里指定是想输出FASTA格式,excel格式还是其他。
- Mygene.info
没用明白的一个网站。但可能有人需要所以放在这里。https://mygene.info/v3/api#/
感觉上应该是专门用于已知gene name之后的各种分析。

浙公网安备 33010602011771号