摘要: 一些基础的操作: import torch as th a=th.rand(3,4) #随机数,维度为3,4的tensor b=th.rand(4)print(a)print(b) a+b tensor([[0.3777, 0.4128, 0.6244, 0.7772], [0.0859, 0.93 阅读全文
posted @ 2020-08-11 22:19 kkzhang 阅读(387) 评论(0) 推荐(0)
摘要: 多人对话过程中存在的问题: 1)对于双方对话:存在明显的Speaker和Listener/addressee.但对于多人会话:就存在很多种情况。Clark【6】给出了对listener的分类 阅读全文
posted @ 2020-08-11 20:17 kkzhang 阅读(23) 评论(0) 推荐(0)
摘要: 面向领域特定目标的对话系统通常需要建模三种类型的输入,即(i)与领域相关的知识库,(ii)对话的历史(即话语序列)和(iii)需要生成响应的当前话语。 在对这些输入进行建模时,当前最先进的模型(如Mem2Seq)通常会忽略知识图和对话上下文中的句子中固有的丰富结构。 受最近结构感知图卷积成功的启发针 阅读全文
posted @ 2020-08-11 16:45 kkzhang 阅读(38) 评论(0) 推荐(0)
摘要: The key mechanism of transformer-based models is cross-attentions, which implicitly form graphs over tokens and act as diffusion operators to facilita 阅读全文
posted @ 2020-08-11 15:10 kkzhang 阅读(55) 评论(0) 推荐(0)