上一页 1 ··· 7 8 9 10 11 12 13 14 15 下一页
摘要: https://baptiste-wicht.com/posts/2017/09/cpp11-performance-tip-when-to-use-std-pow.html 阅读全文
posted @ 2022-06-16 11:04 ijpq 阅读(22) 评论(0) 推荐(0)
摘要: 环境 cuda drvier 11.6 cuda toolkit 11.1 pytorch ver 1.11 conda env # conda package list # packages in environment at /home/tangke/anaconda3/envs/py39tor 阅读全文
posted @ 2022-06-12 18:28 ijpq 阅读(265) 评论(0) 推荐(0)
摘要: 前置知识: virtual table in C++ 对于每个opr,dispatcher构建了一个vtable(c多态性相关概念)。dispatcher的工作就是根据输入的tensor和其他一些meta信息,计算dispatch key,然后根据vtable跳转到相应的函数 c virtual t 阅读全文
posted @ 2022-05-20 16:18 ijpq 阅读(290) 评论(0) 推荐(0)
摘要: class Container { public: virtual double& operator[](int) = 0; virtual int size() const = 0; virtual ̃Container() {} // pure virtual function // const 阅读全文
posted @ 2022-05-20 11:44 ijpq 阅读(54) 评论(0) 推荐(0)
摘要: https://www.jianshu.com/p/ac019dc3a0f7 阅读全文
posted @ 2022-05-09 12:08 ijpq 阅读(26) 评论(0) 推荐(0)
摘要: 核心问题:真值表构建好后,可对其进行优化,并且转换为门电路。这个过程是完全机械的。是如何进行的呢?(计算机组成与设计 软硬件接口 RISCV - Chapter 4.4.1最后) 无关项 分为输入无关项和输出无关项。输入无关项:当输出对于某些输入组合来说是无关项时,可以自由组合这些输入是1还是0. 阅读全文
posted @ 2022-05-05 16:15 ijpq 阅读(140) 评论(0) 推荐(0)
摘要: RAM https://www.cnblogs.com/ijpq/p/16222237.html 阅读全文
posted @ 2022-05-04 20:06 ijpq 阅读(26) 评论(0) 推荐(0)
摘要: 地址宽度2~24,地址宽度(Address Bit Width)是24位,则能够表示的地址数量是$ 2 ^ {24} = 16,777,216$,每个数值最多占用32位(Data Bit Width)。 RAM支持修改数值,通过poke tool实现 内存中的值直接显示在元器件上面,地址是在每一行的 阅读全文
posted @ 2022-05-04 20:06 ijpq 阅读(163) 评论(0) 推荐(0)
摘要: calling convention Entry sequence (the function prologue) a few instructions at the beginning of a function, which prepare the stack and registers for 阅读全文
posted @ 2022-04-23 23:13 ijpq 阅读(1070) 评论(0) 推荐(0)
摘要: 例子 例如需要编译cu时,需要-lcudart,编译命令中要加入 -L/data/cuda/cuda-10.2/cuda/lib64 -lcudart 编译成功: 如果去掉-L/data/cuda/cuda-10.2/cuda/lib64 这是因为没有在默认的动态链接库目录中找到cudart.so 阅读全文
posted @ 2022-04-16 11:55 ijpq 阅读(154) 评论(0) 推荐(0)
上一页 1 ··· 7 8 9 10 11 12 13 14 15 下一页