摘要:
valide_lens是二维数组,假设其如下 tensor([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14], [15, 16, 17, 18, 19]]) 那么对其在第零维进行repeat_interleave后,如下 tensor 阅读全文
posted @ 2025-02-23 17:26
最爱丁珰
阅读(7)
评论(0)
推荐(0)
摘要:
这里查询,键和值的形状不要看书上,看我下面写的文字 对于查询来说,第一维的确是批量大小,可以忽略不管;第二维是一个批量中查询\(z\)的个数;第三维是每个查询\(z\)的特征维度(代码中的query_size) 对于键来说,第一维的确是批量大小,可以忽略不管;第二维是键值对个数,也就是键的个数,也就 阅读全文
posted @ 2025-02-23 16:03
最爱丁珰
阅读(27)
评论(0)
推荐(0)
摘要:
这里的键可以理解成\(x\),值可以理解成\(y\),也就是说每一个\(x\)都会对应一个\(y\)(在这个情形下,\(x\)和\(y\)都可以是向量,而且维度不一定相同);查询可以理解成一个我们想要预测的量\(z\),想要预测\(z\)的输出\(y\)是多少(注意\(z\)的维度不一定要与\(x\ 阅读全文
posted @ 2025-02-23 15:52
最爱丁珰
阅读(71)
评论(0)
推荐(0)
摘要:
Problem Set 1.1 Problem 1.1.1 \(1)\) 基本情况:若\(z=0\),则\(yz=0\),返回正确值 归纳假设:令\(d\)为一个常数,假设\(\forall z<d\),算法返回正确值 归纳步骤:若\(z=d\),利用数学归纳法 若\(z\)为偶数,则返回\(\te 阅读全文
posted @ 2025-02-23 13:42
最爱丁珰
阅读(10)
评论(0)
推荐(0)

浙公网安备 33010602011771号