笨笨和呆呆 - 博客园

2023年12月1日

摘要：在Transformer中，Decoder部分内部的不同层通常可以并行工作，这意味着每个Decoder层可以同时处理整个序列。比如，在处理Self-Attention时，模型可以同时计算所有位置的注意力权重。但在生成输出序列时，尽管Decoder内部的不同层可以并行工作，模型仍然需要按顺序逐步生成阅读全文

posted @ 2023-12-01 11:09 笨笨和呆呆阅读(522) 评论(0) 推荐(0)

transfomer讲解

摘要： https://www.bilibili.com/video/BV1YU4y1c7UT/?p=3&spm_id_from=pageDriver&vd_source=5a8099d424866bf1cdbfa5a7afadeca6 阅读全文

posted @ 2023-12-01 09:18 笨笨和呆呆阅读(54) 评论(0) 推荐(0)

2023年11月30日

Git 文件状态的转换

摘要：很好低使用git 文件的状态转换的了解是非常重要的。文件转换状态其实可以分为四种： untracked:未跟踪，此文件在工作区中，但并没有加入git库，不参与版本控制。通过”git add”,”git commit”可将它置入跟踪库。 unmodify：文件已经git库中，未修改，即版本库中的文阅读全文

posted @ 2023-11-30 16:59 笨笨和呆呆阅读(44) 评论(0) 推荐(0)

2023年11月26日

各大排序算法比较

摘要：阅读全文

posted @ 2023-11-26 17:01 笨笨和呆呆阅读(19) 评论(0) 推荐(0)

2023年11月20日

84.柱状图中最大的矩形单调栈

摘要：阅读全文

posted @ 2023-11-20 09:47 笨笨和呆呆阅读(9) 评论(0) 推荐(0)

2023年11月15日

T检验，F检验和卡方检验，相关系数

摘要： https://www.zhihu.com/question/26970534 阅读全文

posted @ 2023-11-15 09:16 笨笨和呆呆阅读(29) 评论(0) 推荐(0)

2023年11月13日

损失函数

摘要： https://blog.csdn.net/Next_SummerAgain/article/details/129550772 阅读全文

posted @ 2023-11-13 13:52 笨笨和呆呆阅读(9) 评论(0) 推荐(0)

2023年11月11日

悲观剪枝

摘要： https://www.bilibili.com/video/BV175411g7T7/?spm_id_from=333.337.search-card.all.click&vd_source=5a8099d424866bf1cdbfa5a7afadeca6 个人理解，一个人腿被压了去医院，医生说在阅读全文

posted @ 2023-11-11 12:22 笨笨和呆呆阅读(25) 评论(0) 推荐(0)

2023年11月10日

多元高斯分布

摘要： https://www.bilibili.com/video/BV1zf4y1L7mQ/?spm_id_from=333.337.search-card.all.click&vd_source=5a8099d424866bf1cdbfa5a7afadeca6 阅读全文

posted @ 2023-11-10 09:14 笨笨和呆呆阅读(25) 评论(0) 推荐(0)

2023年11月8日

似然和概率的关系

摘要： https://www.bilibili.com/video/BV1CR4y1L7RC/?spm_id_from=333.337.search-card.all.click&vd_source=5a8099d424866bf1cdbfa5a7afadeca6 阅读全文

posted @ 2023-11-08 21:06 笨笨和呆呆阅读(27) 评论(0) 推荐(0)

公告