会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
jasonjunshu
博客园
首页
新随笔
联系
订阅
管理
1
2
下一页
2025年9月8日
NPU架构的一些思考
摘要: vector processing unit(VPU) vpu中一般激活单元做激活,量化, VPU做softmax, normalization等等非线性运算, 只有卷积,矩阵乘, 全连接才在MAA中进行 一下是Samaung 6k MAC架构中的VPU 和激活单元, Conv + RELU + P
阅读全文
posted @ 2025-09-08 17:12 风冷无霜
阅读(12)
评论(0)
推荐(0)
2025年8月21日
u_foreach_bit
摘要: #define u_foreach_bit(b, dword) \ for (uint32_t __dword = (dword), b; \ ((b) = ffs(__dword) - 1, __dword); \ __dword &= ~(1 << (b))) 首先我真的想见了那些写奇奇怪怪宏的
阅读全文
posted @ 2025-08-21 17:46 风冷无霜
阅读(5)
评论(0)
推荐(0)
2025年7月18日
CPU资源被疯狂占用,干掉可疑链接
摘要: 最近在别人的服务器上干活,突然之间机子很卡顿,然后昨天能执行成功的命令竟然都不能执行成功了 然后用top看了下,cpu被一个httpd或者是sshd的进程疯狂占用 此刻顿时觉得不对 立马查看可疑进程的网络链接 然后IT大哥查了下这两个可疑IP,他们真的是"坏人" 立马采用防火墙封掉来自这个ip的所有
阅读全文
posted @ 2025-07-18 08:33 风冷无霜
阅读(24)
评论(0)
推荐(0)
2025年6月16日
通过页表将虚拟地址VA转为物理地址
摘要: 示例分析(物理地址24位) 假设: 虚拟地址空间:32位(n=32) 页大小:4KB(\(P=2^{12}\) → p=12) 物理地址空间:24位(m=24) 关键参数计算: 虚拟地址划分: VPN位数 = 32 - 12 = 20位(高20位) VPO位数 = 12位(低12位) 物理地址划分:
阅读全文
posted @ 2025-06-16 17:21 风冷无霜
阅读(93)
评论(0)
推荐(0)
2025年5月28日
numactl
摘要: numactl -H 可以显示numa 拓扑信息, 从一下命令可以看出,这个服务器有两个节点。 node0拥有32个逻辑cpu, 128G内存。 $numactl -H available: 2 nodes (0-1) node 0 cpus: 0 1 2 3 4 5 6 7 8 9 10 11 1
阅读全文
posted @ 2025-05-28 17:05 风冷无霜
阅读(69)
评论(0)
推荐(0)
2025年5月27日
docker 容器测试cpu 集群
摘要: 采用oneccl中的mpirun 在两个docker 容器上跑集群任务,需要的设置如下: apt install openssh-client apt install openssh-server ssh client配置 $ cat ~/.ssh/config Host 10.100.103.5
阅读全文
posted @ 2025-05-27 17:53 风冷无霜
阅读(11)
评论(0)
推荐(0)
2025年4月11日
pytorch
摘要: torch.cat(tensors, dim=0, *, out=None) → Tensor Concatenates the given sequence of tensors in tensors in the given dimension. All tensors must either
阅读全文
posted @ 2025-04-11 10:45 风冷无霜
阅读(25)
评论(0)
推荐(0)
2025年1月2日
Vulkan VertexInput 相关概念了解
摘要: VkVertexInputBindingDescription 一个buffer下面可以有多个binding, 每一个binding里面可以有多个location struct Vertex { glm::vec2 pos; glm::vec3 color; }; VkVertexInputBind
阅读全文
posted @ 2025-01-02 20:03 风冷无霜
阅读(35)
评论(0)
推荐(0)
2024年11月13日
汇编角度看值传递类对象
摘要: 首先奉上源代码 class A{ private: int i; public: A() { std::cout << "default constructor is called" << std::endl; i = 0; } A(int _i): i(_i) {} A(const A& obj)
阅读全文
posted @ 2024-11-13 09:40 风冷无霜
阅读(13)
评论(0)
推荐(0)
2024年9月26日
float中的denormal表示
摘要: 在float中normal数字表示如下:其中f是小数部分的十进制数值$$Value_{10}=2^{E-127}\times(1.f)$$ 当\(E=1\)的时候,\(.f=\underbrace{{000...000}_2}_\text{23}\)的时候,会得出最小的normal数值是$$Valu
阅读全文
posted @ 2024-09-26 09:42 风冷无霜
阅读(60)
评论(0)
推荐(0)
1
2
下一页