nanoAI

导航

学习Sci. Adv. 关于AMP_generator文章-复现

  1. github打包代码块:https://github.com/jkwang93/AMP-Designer/blob/main/

  1. 环境配置:在Anaconda Prompt中创建虚拟环境“AMPdesign”,python=3.9。本人新手,根据大佬帖子安装pytorch:“https://zhuanlan.zhihu.com/p/1897261918172987396”,本次安装的是2.5.1版本,conda途径安装,安装代码:conda install pytorch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 pytorch-cuda=11.8 -c pytorch -c nvidia
    image

  1. pycharm中打开项目,配置刚刚新建的虚拟环境:文件→设置→项目→Python解释器→添加解释器→添加本地解释器→Conda环境:使用现有环境→选择AMPdesign
    image

  1. 先阅读README,再开始代码复现

3.1 首先运行train_AMP_GPT.py文件。这个文件有几个小错误需要改,按照要求改就好了,比如文件名不统一,np.Inf需改为np.inf等。训练中的状态:image

本地太慢确实不适合跑完整的训练,修改参数epoch=2,batch_size=4, warmup_steps=10进行测试。


3.2


本地先测试。首先将data/prompt_data里面的两个带标签数据集合并,并加上3个表头:comment_text,id,label。
第二至关重要。修改测试参数,将batch_size调为8,epoch调为1,--log_step调为10.不然本地跑不动,会显存报错。
第三,把Save model checkpoint注释掉。不然硬盘存储真的扛不动!!!
注释完后貌似有格式问题,新代码如下:
image
第四,把17行的from pytorchtools import EarlyStopping修改为from early_stop.pytorchtools import EarlyStopping。
还有一些细节的改动,可以直接debug。训练结果:
image
但是好像没有验证集?看不出来有没有过拟合。这样的话最好把带标签的数据给划分一下。


3.3


这一步我们根据步骤先把模型蒸馏一下。

持续更新中...
欢迎指正交流,共同学习进步。邮箱:z1437143688@126.com

posted on 2025-09-27 13:27  Nano牛马  阅读(14)  评论(0)    收藏  举报