03 2020 档案

摘要:https://github.com/Kyubyong/neural_chinese_transliterator 使用seq2seq的方式,将拼音序列转换为汉字序列,模型结构: 1.准备训练数据 zho_news_2007-2009_1M-sentences.txt,100w,分词,实际上没有使用 阅读全文
posted @ 2020-03-24 16:47 AliceYing
摘要:https://www.aclweb.org/anthology/D19-5522.pdf 论文解读 包括一个降噪自动编码器(DAE)和一个解码器。DAE生成可以将错误文本修改为正确文本的可能的候选项矩阵,解码器在这个矩阵中寻找最佳候选项路径作为输出。 DAE因为可以在大规模正常语料数据上无监督训练 阅读全文
posted @ 2020-03-09 12:38 AliceYing