上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 68 下一页
摘要: 在Transformer中,Decoder部分内部的不同层通常可以并行工作,这意味着每个Decoder层可以同时处理整个序列。比如,在处理Self-Attention时,模型可以同时计算所有位置的注意力权重。 但在生成输出序列时,尽管Decoder内部的不同层可以并行工作,模型仍然需要按顺序逐步生成 阅读全文
posted @ 2023-12-01 11:09 笨笨和呆呆 阅读(522) 评论(0) 推荐(0)
摘要: https://www.bilibili.com/video/BV1YU4y1c7UT/?p=3&spm_id_from=pageDriver&vd_source=5a8099d424866bf1cdbfa5a7afadeca6 阅读全文
posted @ 2023-12-01 09:18 笨笨和呆呆 阅读(54) 评论(0) 推荐(0)
摘要: 很好低使用git 文件的状态转换的了解是非常重要的。 文件转换状态其实可以分为四种: untracked:未跟踪,此文件在工作区中,但并没有加入git库,不参与版本控制。 通过”git add”,”git commit”可将它置入跟踪库。 unmodify:文件已经git库中,未修改,即版本库中的文 阅读全文
posted @ 2023-11-30 16:59 笨笨和呆呆 阅读(44) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2023-11-26 17:01 笨笨和呆呆 阅读(19) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2023-11-20 09:47 笨笨和呆呆 阅读(9) 评论(0) 推荐(0)
摘要: https://www.zhihu.com/question/26970534 阅读全文
posted @ 2023-11-15 09:16 笨笨和呆呆 阅读(29) 评论(0) 推荐(0)
摘要: https://blog.csdn.net/Next_SummerAgain/article/details/129550772 阅读全文
posted @ 2023-11-13 13:52 笨笨和呆呆 阅读(9) 评论(0) 推荐(0)
摘要: https://www.bilibili.com/video/BV175411g7T7/?spm_id_from=333.337.search-card.all.click&vd_source=5a8099d424866bf1cdbfa5a7afadeca6 个人理解,一个人腿被压了去医院,医生说在 阅读全文
posted @ 2023-11-11 12:22 笨笨和呆呆 阅读(25) 评论(0) 推荐(0)
摘要: https://www.bilibili.com/video/BV1zf4y1L7mQ/?spm_id_from=333.337.search-card.all.click&vd_source=5a8099d424866bf1cdbfa5a7afadeca6 阅读全文
posted @ 2023-11-10 09:14 笨笨和呆呆 阅读(25) 评论(0) 推荐(0)
摘要: https://www.bilibili.com/video/BV1CR4y1L7RC/?spm_id_from=333.337.search-card.all.click&vd_source=5a8099d424866bf1cdbfa5a7afadeca6 阅读全文
posted @ 2023-11-08 21:06 笨笨和呆呆 阅读(27) 评论(0) 推荐(0)
上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 68 下一页