语言模型

摘要: 定义 \(p(w_1,...,w_n)=\prod_{i=1,...,n}p(w_i|w1,...,w_{i-1})\),$p(w_i|w1,...,w_)$通常是一个(循环)神经网络 2018年之前用于文本生成,如机器翻译和语音识别;2018年之后,在大量数据上预训练,在任何特定任务上微调 词嵌入 阅读全文
posted @ 2021-03-08 23:11 锋上磬音 阅读(315) 评论(0) 推荐(0)