上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 132 下一页
摘要: 目录P421P422 P421 anchors_bbox_map = torch.full((num_anchors,), -1, dtype=torch.long, device=device) max_ious, indices = torch.max(jaccard, dim=1) anc_i 阅读全文
posted @ 2025-08-01 16:10 最爱丁珰 阅读(4) 评论(0) 推荐(0)
摘要: 目录P410P412 P410 \(\frac{1}{\text{RPM}}\)是转一圈所需要的分钟数,于是就可以理解旋转时间和传送时间的公式了 P412 PCI总线跟计网里面说的总线一样,所有设备都可以看到里面的数据;PCIe相当于点对点的总线 阅读全文
posted @ 2025-08-01 00:12 最爱丁珰 阅读(4) 评论(0) 推荐(0)
摘要: 目录P400P401P402P404 P400 这里区分一下供电和干扰的区别:供电就是字面意思,SRAM和DRAM都需要供电,所以我们把电脑关机后重新打开电脑就要从硬盘中重新加载所有东西;干扰是在供电途中,对稳定电压的扰乱,SRAM不怕干扰,所以不用刷新和校验码,DRAM怕干扰,所以需要刷新和校验码 阅读全文
posted @ 2025-07-31 15:30 最爱丁珰 阅读(5) 评论(0) 推荐(0)
摘要: 目录P379 P379 投机执行中,处理器避免修改实际的寄存器或者内存位置,与前面提到的寄存器重命名有关。一个寄存器可能有几百个副本,同时 阅读全文
posted @ 2025-07-31 09:04 最爱丁珰 阅读(7) 评论(0) 推荐(0)
摘要: 注意,K和W是一一对应的关系,于是这里就是在说\(\forall\)X,经过卷积层K和矩阵W得到的结果是一样的;\(\forall\)Y,经过转置卷积层K和矩阵W.T得到的结果是一样的 至于那个什么反向传播,应该是他没说清楚 阅读全文
posted @ 2025-07-30 23:18 最爱丁珰 阅读(4) 评论(0) 推荐(0)
摘要: 然后讲多输出通道那里,注意说的是“每个”输出通道“都有”一个三维卷积核 阅读全文
posted @ 2025-07-30 22:49 最爱丁珰 阅读(7) 评论(0) 推荐(0)
摘要: 目录P375P376 P375 图5-29并行性提高的原因应该是:在第\(i\)个循环正在执行第二个mul的时候,由于add和load很快,所以第\(i+1\)个循环的第一个mul已经开始执行了,第\(i\)个循环执行完第二个mul之后准备执行第\(i+1\)个循环的第二个mul的时候,就可以无缝衔 阅读全文
posted @ 2025-07-30 22:47 最爱丁珰 阅读(7) 评论(0) 推荐(0)
摘要: 目录P367 P367 整数加法CPE下降的原因:在P365讲述的其它性能因素,就是说每次循环,除了循环体,还有一些额外的开销,这些额外的开销与循环体的具体内容没有关系,而这些额外开销是瓶颈;这里我们进行循环展开之后,循环的总次数就减少了,额外开销不再是瓶颈,瓶颈变成了整数加法;由于总的加法次数没有 阅读全文
posted @ 2025-07-30 19:51 最爱丁珰 阅读(25) 评论(0) 推荐(0)
摘要: 目录P357 P357 这里说的指令级并行与第四章讲的流水线不同,这里指的是将整个程序的指令划分成若干独立的部分,而这些独立的部分并行进行第四章讲的流水线结构 阅读全文
posted @ 2025-07-30 18:45 最爱丁珰 阅读(5) 评论(0) 推荐(0)
摘要: 目录P361 P361 下面的图片显示了这里说的流水线是什么意思(下面的图将一个乘法操作分成了三个微操作,每一个乘法在运算单元里面按照顺序执行三个微操作阶段) 所以这里的流水线达成了并行性。注意这里的并行性并不是指多个功能单元的并行性,而是单个并行单元的执行不同阶段的不同部分可以同时进行 发射时间指 阅读全文
posted @ 2025-07-30 16:16 最爱丁珰 阅读(8) 评论(0) 推荐(0)
上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 132 下一页