摘要:最近(以及预感接下来的一年)会读很多很多的paper......不如开个帖子记录一下读paper心得 SysML相关的文章很多来源于上学期的8980课。有些和具体field(比如DB/architecture/...)相关的就放到各个field的分类里啦,这里放一些不好分类的 Class Blog
阅读全文
摘要:Textbook:《计算机组成与设计——硬件/软件接口》 HI《计算机体系结构——量化研究方法》 QR 最后一节来看看如何实现parallelism 在多处理器系统中,每个处理器(core)可能有自己专属的cache,然后多处理器共享memory。在这种情况下,当多个线程(核心)对同一个变量进行读写
阅读全文
摘要:Textbook:《计算机组成与设计——硬件/软件接口》 HI《计算机体系结构——量化研究方法》 QR Branch Prediction 对于下面的指令: 前面i1, i2, i3都是有依赖的,计算起来就很慢。如果在i4的分支语句中使用了branch prediction,就可以不用等r3算出来,
阅读全文
摘要:Textbook:《计算机组成与设计——硬件/软件接口》 HI《计算机体系结构——量化研究方法》 QR 超标量 前面讲过超标量的概念。超标量的目的就是实现指令级并行(Instruction Level Parallelism),来解决stall太多的问题。 超标量(Super Scalar) 将一条
阅读全文
摘要:Textbook:《计算机组成与设计——硬件/软件接口》 HI《计算机体系结构——量化研究方法》 QR 在前面一节里我们有了一块简单的RISC CPU,包括指令集和各个部件。现在我们来看看怎么在它的基础上构建一个pipeline pipeline pipeline的概念本科的时候其实学过了...大意
阅读全文
摘要:Textbook:《计算机组成与设计——硬件/软件接口》 HI《计算机体系结构——量化研究方法》 QR 这节我们来看CPU内部的一些东西。 Instruction Set Architecture 指令集是介于硬件(CPU microarchitecture / IO / ....)和软件(comp
阅读全文
摘要:Textbook: 《计算机组成与设计——硬件/软件接口》 HI 《计算机体系结构——量化研究方法》 QR 这是youtube上一个非常好的memory system的课。 1. Physical Memory 这里我们重点关注DRAM 从概念上分为:Channel > DIMM > Rank >
阅读全文
摘要:Textbook: 《计算机组成与设计——硬件/软件接口》 HI 《计算机体系结构——量化研究方法》 QR Ch4. Cache Optimization 本章要讨论的问题就是 How to Improve Cache Performance? 前面讲过 Average memory access
阅读全文
摘要:这次就边学边总结吧,不等到最后啦 Textbook: 《计算机组成与设计——硬件/软件接口》 HI 《计算机体系结构——量化研究方法》 QR Ch3. Memory Hierarchy 1. Physical Memory SRAM:CPU缓存(比如PentiumII的外置二级缓存芯片) DRAM:
阅读全文
摘要:图片版在这:https://www.cnblogs.com/pdev/p/10576835.html 上完5103其实就该总结一下的......还是懒 (呵 1. 进程栈 函数调用时,函数参数、返回地址、环境、函数内非static的局部变量存入栈。(栈空间是专门留给函数用的) 程序内所有malloc
阅读全文
摘要:Ref: https://wdxtub.com/2016/03/20/openmp-guide/ 简介 这门课作为 ECE 中少有的跟计算机科学相关的课,自然是必上不可。不过无论是 OpenMP 还是 CUDA,对于平时极少接触并行编程的我来说,都是十分吃力的,第一次作业的 OpenMP 编程已经让
阅读全文