上一页 1 2 3 4 5 6 ··· 39 下一页
摘要: 并行计算架构和编程 | Assignment 4: cs149gpt and Lecture 10 - Efficiently Evaluating DNNs on GPUs from pixiv 杉8 基础知识 Transformer and Attention PPT:Efficiently Evaluating DNNs on GPUs 对应课程:Stanford CS149 I Parallel Computing I 2023 I Lecture 10 - Ef 阅读全文
posted @ 2025-05-31 19:25 次林梦叶 阅读(63) 评论(0) 推荐(0)
摘要: 深度学习 Deep Learning | 基于 3Blue1Brown 教学的总结 3Blue1Brown 神经网络的结构 这里作者先从神经网络初始最著名的应用--识别手写数字图片中的数字为例,讲解神经网络的基本架构: 我们将一张图片中的全部像素展开为一列,每一个像素就是初始输入神经元中的值 这上述角度,我们可以神经元看成“装有数字的容器”,里面的数字是“激活值” 其值越大该神经元 阅读全文
posted @ 2025-05-24 21:41 次林梦叶 阅读(261) 评论(0) 推荐(0)
摘要: 并行计算架构和编程 | 缓存一致性 from pixiv 资料 并行计算(三):缓存一致性 Snooping-Based Cache Coherence 《内存一致性与缓存一致性》笔记(一):基础 基础知识 注意点 内存一致性的粒度为某个内存位置(如一个变量或一个字大小的数据) 缓存一致性的粒度为缓存行(cache line),所以这 阅读全文
posted @ 2025-05-19 22:44 次林梦叶 阅读(36) 评论(0) 推荐(0)
摘要: 编译原理 | 目录 from pixiv 写在前面 嗨嗨,我又开新坑了,这次希望能够实现出自己的编译器。 这次我选择PKU 编译原理实践作为实验练习,选择NJU 编译原理作为视频课程,龙书作为课本进行学习。 实验 视频课程 大佬博客 阅读全文
posted @ 2025-05-16 12:03 次林梦叶 阅读(30) 评论(0) 推荐(0)
摘要: 并行计算架构和编程 | Assignment 3: A Simple CUDA Renderer from pixiv GPU的编译 使用 nvcc 一步完成编译与链接 nvcc -o vector_add vector_add.cu nvcc 会自动将设备代码编译为 PTX/Cubin,调用主机编译器(如 g++)编译主机部分,并自动链接 CUDA 运行时库 cudart 等 或者分步编译与手 阅读全文
posted @ 2025-05-13 17:05 次林梦叶 阅读(42) 评论(0) 推荐(0)
摘要: 系统构建 | Makefile and Conda from pixiv 前言 教程来自:Github-Makefile_tutor V1:Simplest C project Makefile的强制执行 与 调试 当你在执行 make 时遇到提示 make: Nothing to be done for 'all',这通常意味着所有目标文件都已经是 阅读全文
posted @ 2025-05-08 17:21 次林梦叶 阅读(88) 评论(0) 推荐(0)
摘要: 性能分析 | 评分法 from pixiv 层次几何平均 参考资料 Hierarchical Means: Single Number Benchmarking with Workload Cluster Analysis PowerPoint Presentation Self-organizing map Self- 阅读全文
posted @ 2025-04-28 17:23 次林梦叶 阅读(21) 评论(0) 推荐(0)
摘要: Package Manager from pixiv 软件管理包的历史 Linux 内核由 Linus Torvalds 开发,是操作系统的核心组件,负责硬件管理和进程调度,其发行版分为Debian系和Red Hat系 Debian: 社区驱动:由全球开发者协作维护,遵循自由软件原则,提供稳定、无商业约束的发行版 衍生系统:Ubu 阅读全文
posted @ 2025-04-26 23:03 次林梦叶 阅读(84) 评论(0) 推荐(0)
摘要: Environment Modules from pixiv Environment Modules可通过允许动态制作或删除相关环境变量组来帮助用户管理其UNIX或Linux Shell环境。 Environment Modules 参考博客教程 官方文档 安装Environment Modules 源码安装编译 手动下载源码: cd ~ 阅读全文
posted @ 2025-04-26 22:56 次林梦叶 阅读(78) 评论(0) 推荐(0)
摘要: 性能测试 | 性能测试分析工具 from pixiv Tracy Tracy 是一款实时、纳秒级分辨率的混合帧和采样剖析器,可用于远程或嵌入式遥测游戏和其他应用程序。它可以对 CPU(C、C++11、Lua)、GPU(OpenGL、Vulkan、Direct3D 11/12、OpenCL)和内存进行剖析。它还能监控线程所持有的锁, 阅读全文
posted @ 2025-04-26 22:47 次林梦叶 阅读(23) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 ··· 39 下一页