05 2025 档案
摘要:
from pixiv 杉8 基础知识 Transformer and Attention PPT:Efficiently Evaluating DNNs on GPUs 对应课程:Stanford CS149 I Parallel Computing I 2023 I Lecture 10 - Ef
阅读全文

摘要:
3Blue1Brown 神经网络的结构 这里作者先从神经网络初始最著名的应用--识别手写数字图片中的数字为例,讲解神经网络的基本架构: 我们将一张图片中的全部像素展开为一列,每一个像素就是初始输入神经元中的值 这上述角度,我们可以神经元看成“装有数字的容器”,里面的数字是“激活值” 其值越大该神经元
阅读全文

摘要:
from pixiv 资料 并行计算(三):缓存一致性 Snooping-Based Cache Coherence 《内存一致性与缓存一致性》笔记(一):基础 基础知识 注意点 内存一致性的粒度为某个内存位置(如一个变量或一个字大小的数据) 缓存一致性的粒度为缓存行(cache line),所以这
阅读全文

摘要:
from pixiv 写在前面 嗨嗨,我又开新坑了,这次希望能够实现出自己的编译器。 这次我选择PKU 编译原理实践作为实验练习,选择NJU 编译原理作为视频课程,龙书作为课本进行学习。 实验 视频课程 大佬博客
阅读全文

摘要:
from pixiv GPU的编译 使用 nvcc 一步完成编译与链接 nvcc -o vector_add vector_add.cu nvcc 会自动将设备代码编译为 PTX/Cubin,调用主机编译器(如 g++)编译主机部分,并自动链接 CUDA 运行时库 cudart 等 或者分步编译与手
阅读全文

摘要:
from pixiv 前言 教程来自:Github-Makefile_tutor V1:Simplest C project Makefile的强制执行 与 调试 当你在执行 make 时遇到提示 make: Nothing to be done for 'all',这通常意味着所有目标文件都已经是
阅读全文
