摘要: (来自BERT论文) config文件定义了模型的超参数。 但是,由于此模型在64GB内存上训练,所以如果个人使用的话,需要调整超参数。 内存大小影响因子包括: max_seq_length,发布模型长度不超过512,你可以使用更短的。 train_batch_size(成正比) Model typ 阅读全文
posted @ 2020-10-25 19:57 千心 阅读(846) 评论(0) 推荐(0)