摘要: 本文来自李纪为博士的论文 Deep Reinforcement Learning for Dialogue Generation。 1,概述 当前在闲聊机器人中的主要技术框架都是seq2seq模型。但传统的seq2seq存在很多问题。本文就提出了两个问题: 1)传统的seq2seq模型倾向于生成安全 阅读全文
posted @ 2019-03-04 15:03 微笑sun 阅读(2129) 评论(1) 推荐(1)