摘要:
束搜索(Beam Search)、贪心搜索(Greedy Search)和穷举搜索(Exhaustive Search)是在搜索领域常用的三种搜索算法,它们在不同的场景下有着不同的特点和应用。 束搜索(Beam Search): 束搜索是一种用于寻找最有可能的输出序列的搜索算法,常用于序列生成任务, 阅读全文
posted @ 2023-11-15 17:29
Yohoc
阅读(1144)
评论(0)
推荐(0)
摘要:
我们将使用两个循环神经网络的编码器和解码器, 并将其应用于序列到序列(sequence to sequence,seq2seq)类的学习任务。 编码器 由于这里使用的是门控循环单元, 所以在最后一个时间步的多层隐状态的形状是 (隐藏层的数量,批量大小,隐藏单元的数量)。 如果使用长短期记忆网络,st 阅读全文
posted @ 2023-11-15 16:58
Yohoc
阅读(313)
评论(0)
推荐(0)
摘要:
正如我们在 9.5节中所讨论的, 机器翻译是序列转换模型的一个核心问题, 其输入和输出都是长度可变的序列。 为了处理这种类型的输入和输出, 我们可以设计一个包含两个主要组件的架构: 第一个组件是一个编码器(encoder): 它接受一个长度可变的序列作为输入, 并将其转换为具有固定形状的编码状态。 阅读全文
posted @ 2023-11-15 12:54
Yohoc
阅读(590)
评论(0)
推荐(0)
摘要:
语言模型是自然语言处理的关键, 而机器翻译是语言模型最成功的基准测试。 因为机器翻译正是将输入序列转换成输出序列的 序列转换模型(sequence transduction)的核心问题。 序列转换模型在各类现代人工智能应用中发挥着至关重要的作用。机器翻译(machine translation)指的 阅读全文
posted @ 2023-11-15 11:41
Yohoc
阅读(284)
评论(0)
推荐(0)

浙公网安备 33010602011771号