摘要: 1.什么是Bert? Bert用我自己的话就是:使用了transformer中encoder的两阶段两任务两版本的语言模型 没错,就是有好多2,每个2有什么意思呢? 先大体说一下,两阶段是指预训练和微调阶段,两任务是指Mask Language和NSP任务,两个版本是指Google发布的Base版本 阅读全文
posted @ 2020-08-24 17:25 hello!元卜 阅读(2019) 评论(0) 推荐(0)