GENIE预训练过程

token输入

pretrain_data_util.py

mask_span_num = int((id_len * self.mask_pro) // self.span_size) + 1

mask的片段数，片段大小为8，mask概率为0.3

gaussian_diffusion.py

gaussian_diffusion.py

Diffusion_LM.py

posted @ 2023-08-11 10:27 ︶ㄣ演戲ㄣ阅读(21) 评论(0) 收藏举报

刷新页面返回顶部