05 2025 档案

摘要:并行计算架构和编程 | Assignment 4: cs149gpt and Lecture 10 - Efficiently Evaluating DNNs on GPUsfrom pixiv 杉8 基础知识 Transformer and Attention PPT:Efficiently Evaluating DNNs on GPUs 对应课程:Stanford CS149 I Parallel Computing I 2023 I Lecture 10 - Ef 阅读全文
posted @ 2025-05-31 19:25 次林梦叶 阅读(60) 评论(0) 推荐(0)
摘要:深度学习 Deep Learning | 基于 3Blue1Brown 教学的总结3Blue1Brown 神经网络的结构 这里作者先从神经网络初始最著名的应用--识别手写数字图片中的数字为例,讲解神经网络的基本架构: 我们将一张图片中的全部像素展开为一列,每一个像素就是初始输入神经元中的值 这上述角度,我们可以神经元看成“装有数字的容器”,里面的数字是“激活值” 其值越大该神经元 阅读全文
posted @ 2025-05-24 21:41 次林梦叶 阅读(242) 评论(0) 推荐(0)
摘要:并行计算架构和编程 | 缓存一致性from pixiv 资料 并行计算(三):缓存一致性 Snooping-Based Cache Coherence 《内存一致性与缓存一致性》笔记(一):基础 基础知识 注意点 内存一致性的粒度为某个内存位置(如一个变量或一个字大小的数据) 缓存一致性的粒度为缓存行(cache line),所以这 阅读全文
posted @ 2025-05-19 22:44 次林梦叶 阅读(34) 评论(0) 推荐(0)
摘要:编译原理 | 目录from pixiv 写在前面 嗨嗨,我又开新坑了,这次希望能够实现出自己的编译器。 这次我选择PKU 编译原理实践作为实验练习,选择NJU 编译原理作为视频课程,龙书作为课本进行学习。 实验 视频课程 大佬博客 阅读全文
posted @ 2025-05-16 12:03 次林梦叶 阅读(30) 评论(0) 推荐(0)
摘要:并行计算架构和编程 | Assignment 3: A Simple CUDA Rendererfrom pixiv GPU的编译 使用 nvcc 一步完成编译与链接 nvcc -o vector_add vector_add.cu nvcc 会自动将设备代码编译为 PTX/Cubin,调用主机编译器(如 g++)编译主机部分,并自动链接 CUDA 运行时库 cudart 等 或者分步编译与手 阅读全文
posted @ 2025-05-13 17:05 次林梦叶 阅读(40) 评论(0) 推荐(0)
摘要:系统构建 | Makefile and Condafrom pixiv 前言 教程来自:Github-Makefile_tutor V1:Simplest C project Makefile的强制执行 与 调试 当你在执行 make 时遇到提示 make: Nothing to be done for 'all',这通常意味着所有目标文件都已经是 阅读全文
posted @ 2025-05-08 17:21 次林梦叶 阅读(86) 评论(0) 推荐(0)