上一页 1 2 3 4 5 6 7 ··· 39 下一页
摘要: 代码插桩化 from pixiv 理论 代码插桩化 插桩所需的计时器 软件和硬件定时器 软件定时器:系统范围的高分辨率定时器如C++中的std::chrono 硬件定时器:时间戳计数器(TSC):这是一种硬件定时器,实现为硬件寄存器。 不同架构下(x86,arch64,riscv)获取时间戳计数器的方式可能不同 阅读全文
posted @ 2025-04-26 13:14 次林梦叶 阅读(84) 评论(0) 推荐(0)
摘要: 并行计算架构和编程 | Assignment 2: Building A Task Execution Library from the Ground Up from pixiv PART_A 这里我将重点对TaskSystemParallelThreadPoolSleeping的实现进行讨论。 这里实际上要求我们实现线程池,在此基础上我还实现了任务队列,当然对于这题实际上并不需要用任务队列来管理动态分配,使用了任务队列执行速度会有所下降 我参考的通用性 阅读全文
posted @ 2025-04-14 17:25 次林梦叶 阅读(39) 评论(0) 推荐(0)
摘要: 性能分析 | 分支预测 from pixiv 基础知识 参考课本 基本块 我们如何确定程序控制流? 我们基本上忽略基本块中的其他指令,因为分支总是基本块中的最后一个指令。 由于基本块中的所有指令都保证执行一次,因此我们只能关注将“代表”整个基本块的分支。因此,如果我们跟踪每个分支的结果,就可以重建程序的整个逐行执行路径。 阅读全文
posted @ 2025-04-06 16:17 次林梦叶 阅读(42) 评论(0) 推荐(0)
摘要: CSAPP | 优化程序性能 from pixiv 优化程序性能 消除不必要的工作 循环不变式外提 减少循环函数调用 减少循环访存 理解编译器的能力和局限性 编译器只对程序进行保守的,安全的优化 编译器会假设最坏的情况,若优化在此种情况下可能导致程序结果改变,编译器不会执行优化 如指针,指针可能同时指向同一个地址 在超标量乱序执 阅读全文
posted @ 2025-04-03 17:27 次林梦叶 阅读(66) 评论(0) 推荐(0)
摘要: 并行计算架构和编程 | Parallel Programing from pixiv Parallel Programing Basics Creating a parallel program 并行加速比的下限:Amdahl’s Law(阿姆达尔定律) 并行程序的宏观思考过程可总结如下: 挖掘工作可并行的部分。 划分工作。 管理数据的方面,沟通,同步。 最初我 阅读全文
posted @ 2025-03-27 22:00 次林梦叶 阅读(66) 评论(0) 推荐(0)
摘要: 并行计算架构和编程 | Assignment 1: Performance Analysis on a Quad-Core CPU from pixiv Assignment 1: Performance Analysis on a Quad-Core CPU Environment Setup CPU信息 Architecture: x86_64 CPU op-mode(s): 32-bit, 64-bit Address s 阅读全文
posted @ 2025-03-22 14:54 次林梦叶 阅读(79) 评论(0) 推荐(0)
摘要: 性能分析 | Memory Bound from pixiv 基于LMbench测试LLC perf-book -- 内存延迟和带宽 工具与术语 LLC延迟(Last Level Cache Latency) 是指处理器访问最后一级缓存(通常是L3缓存)中的数据所需的时间延迟。 LMbench LMbench是Intel旗下的内存测试工具 阅读全文
posted @ 2025-03-21 11:36 次林梦叶 阅读(223) 评论(0) 推荐(0)
摘要: KTransformer + DeepSeek 部署方案 from pixiv 基础 Hugging Face 什么是Hugging Face? -- Hugging Face Transformers 萌新完全指南 Hugging Face的历史 模型量化技术概述及 GGUF/GGML 文件格式解析 from AI-Guide-and-Demos-zh_ 阅读全文
posted @ 2025-03-15 16:26 次林梦叶 阅读(363) 评论(0) 推荐(0)
摘要: Linux | 堆内存管理 from pixiv 进程的地址空间 jyy 进程的地址空间 Linux 堆内存管理深入分析 如何查看Linux进程的地址空间? 答: pmap /proc/$PID/maps /proc文件系统 动态内核信息: /proc 是一个虚拟文件系统,主要提供内核和正在运行的进程的信息。它不是存储在磁盘上 阅读全文
posted @ 2025-03-15 15:23 次林梦叶 阅读(47) 评论(0) 推荐(0)
摘要: SkipList 跳表 + Memory pool 内存池 from pixiv 基础跳表原理 【编程】动画解析 Redis zset 的底层结构:跳表:原理讲解+代码实现 层峦叠嶂:跳表结构讲解和 C++ 实现: 数据原理讲解+代码实现 跳表是一种类似于链表的数据结构。更加准确地说,跳表是对有序链表的改进。 为方便讨论,后续所有有序链表默认为 升序 排序。 阅读全文
posted @ 2025-03-13 22:45 次林梦叶 阅读(35) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 ··· 39 下一页