全栈生信 | PyMol使用教程
生信全栈,最后一栈肯定就是蛋白了,做到下游离不开蛋白。
- 机制:大部分机制其实就是PPI,你发现一个表型里重要的一个PPI,就是机制;
- 功能:定位了核心蛋白,一个最自然的问题就是蛋白的每个domain的功能是什么,想要成药最好知道蛋白结构;
- 药物:一旦知道蛋白结构,开发和优化药物就变得简单得多了,药物相关的分析就是下一个全栈了;
PyMol的定位是什么,一句话就是:蛋白结构的操作的工具箱,瑞士军刀,但本身没有什么高级的分析。
如果你要做结构预测,那就用alphafold
如果要做docking,就用其他工具
如果要做MD,也要有对应的工具
但做完任何结构的分析,最终都要导入到PyMol里进行分析,因为这个工具就是用来处理蛋白结构文件的。
PyMol提供命令行输入,类似SQL语句,非常适合批量操作,也很geek。
基本的选择,改变颜色
# 改变PyMol里SOX9某个片段的颜色 color red, SOX9 and resi 98-181 # 改变BAF里nuclesome的颜色 select baf_subunits, BAF and chain A+G+D+B+C+E+F+H color grey, baf_subunits select SOX9, SOX9_AF and chain A color orange, SOX9 # 改变DNA颜色 select dna, resn DA+DT+DG+DC color pink, dna select B1, BAF and chain M color green, B1
改变显示方式
# BAF改为surface显示 show surface, BAF color skyblue, BAF set surface_quality, 1 set transparency, 0.2 # 让它稍微透明点 hide surface, dna show cartoon, dna save SOX9_BAF_B1.pse
提取溶剂暴露区
# 溶剂暴露区 cmd.get_area("B1", load_b=1) select exposed_residues, B1 and b > 20 color white, exposed_residues # BAF 复合物表面中“可能用于结合”的区域 cmd.get_area("B1", load_b=1) select surface_residues, B1 and b > 1 select exposed_protein, surface_residues and polymer.protein color white, exposed_protein save exposed_patch.pdb, exposed_protein hide surface, B1 show cartoon, B1 # 提取保存蛋白序列 save exposed_patch.pdb, exposed_protein
多序列比对
# Clustal Omega #------------------------------- select B1_DNA, dna or histones or B1 save B1_DNA.pdb, B1_DNA
alphafold预测结构
----- util.cbc load alphafold/SMARCB1_FL_unrelaxed_alphafold2_multimer_v3_model_1_seed_000.pdb, alpha_B1 align B1, alpha_B1 super B1, alpha_B1 color red, alpha_B1 save B1_PDB_AlphaFold.pse
神器的结构对其,非常有用
------- # select chain select B1, chain B select SOX9, chain A select true_B1, chain M # aligh two B1 s super B1, true_B1 align B1, true_B1 color red, SOX9 save first_trial_align_SOX9_B1.pse select SOX9_HMG, SOX9 and resi 98-181 color blue, SOX9_HMG