摘要:        
0、引言 本文记录使用pytorch、huggingface/transformer 框架工作流程,内容包括: 数据读取 数据预处理(split shuffle) 预训练模型下载和准备(预训练模型参数下载,模型对应Token及超参初始化) 模型训练、验证、结果测试 模型本地持久化 训练过程数据可视化    阅读全文
        
            posted @ 2021-09-14 17:23
Joshua王子
阅读(861)
评论(0)
推荐(0)
        
        
 
                    
                 浙公网安备 33010602011771号
浙公网安备 33010602011771号