会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
牛犁heart
Stay Hungry,Stay Foolilsh
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
···
42
下一页
2023年4月2日
C++ condition_variable 条件变量
摘要: 本节来了解下C++11 中关于条件变量(condition_variable) 的相关知识,这一部分的内容相信网上已经有了很多的分享,这里仅是对该部分内容学习的记录、总结。 条件变量(condition_variable) 条件变量是一种多线程的同步机制,它能够阻塞线程,直到某一条件满足。条件变量要
阅读全文
posted @ 2023-04-02 22:35 牛犁heart
阅读(370)
评论(0)
推荐(0)
2023年3月27日
TVM图级优化了解
摘要: TVM图级优化按照优化范围,可分为局部优化和全局优化 局部优化是TVM图级优化的重点,其中算子融合是AI编译器必不可少的优化方法。 算子融合核心思想就是将多个算子合并成一个内核,因而无需将中间结果写回全局内存,减少了中间变量的分配,也减少了片上缓存和片外存储之间的数据传输。 那算子融合也是有条件的,
阅读全文
posted @ 2023-03-27 00:13 牛犁heart
阅读(434)
评论(0)
推荐(0)
2023年3月12日
AI编译器及TVM整体架构
摘要: 虽然之前也依据tvm官方文档写过一篇关于TVM架构的博客,但总感觉属于一种身在此山中的感觉(偏向于TVM实现的各个模块),并没有一览众山小的即视感(对框架的整体理解)。 因此,今天再次请求出战... 华丽的分割线 首先呢,想先来介绍下常规编译器的结构和特征 常规的编译器通常是由前端(frontend
阅读全文
posted @ 2023-03-12 17:00 牛犁heart
阅读(1820)
评论(0)
推荐(0)
2023年3月7日
C++11 thread_local关键字
摘要: 这是一篇科普文--关于thread_local关键字 首先,C++11之前并没有对并发进行任何的支持,C++11首次提供了以下的支持: 语言核心定义了一个内存模型,保证当更改"被两个不同线程使用"的两个object时,他们彼此独立,而引用thread_local关键字 标准库支持启动多线程,包括传递
阅读全文
posted @ 2023-03-07 23:39 牛犁heart
阅读(370)
评论(0)
推荐(0)
2023年3月5日
C++重载底层原理
摘要: 好吧,承认是自己浅薄了 当被问起C++重载时,嘴角不自觉的微微上扬,然后脱口而出,C++重载的原则: 函数名相同,函数参数列表不同(类型、个数、顺序) 匹配原则1:严格匹配,找到再调用 匹配原则2:通过隐式类型转换寻求一个匹配,找到则调用 注:返回类型不构成重载条件 C++编译时多态也是由重载函数来
阅读全文
posted @ 2023-03-05 13:32 牛犁heart
阅读(468)
评论(0)
推荐(1)
2023年3月4日
深度学习面试相关
摘要: 批量归一化(BN)如何实现?作用 实现过程: 计算训练阶段mini_batch数量激活函数前结果的均值和方差,然后对其进行归一化,最后对其进行放缩和平移。 作用: 可以使用更高的学习率进行优化 移除或使用较低的dropout 降低L2权重衰减系数 调整数据的分布,不考虑激活函数,它让没一层的输出归一
阅读全文
posted @ 2023-03-04 20:47 牛犁heart
阅读(106)
评论(0)
推荐(0)
2023年2月19日
TVM相关
摘要: TVM介绍 为解决深度学习框架和硬件后端适配问题,华盛顿大学的陈天奇等人提出了TVM. TVM是一个端到端的全栈编译器,包括统一的IR堆栈和自动代码生成方法,其主要功能是优化在CPU、GPU和其他定制AI芯片上执行的AI模型,通过自动转换计算图,实现计算模式的融合和内存利用率最大化,并优化数据布局,
阅读全文
posted @ 2023-02-19 21:49 牛犁heart
阅读(353)
评论(0)
推荐(0)
2023年2月16日
GDB调试Core文件出现问号?的原因
摘要: 函数的调用其实是函数的入栈出栈操作,但当程序栈因程序的错误导致破坏了栈,这时候就会导致gdb解析core文件时解析不出来的情况,即是问号(?) 那还能做点什么呢? 可以通过打印$rbp$和$rsp$的值得到最后调用栈的栈底和栈顶。 (gdb) p $rbp $40 = (void *) 0x7fff
阅读全文
posted @ 2023-02-16 23:48 牛犁heart
阅读(1414)
评论(0)
推荐(0)
2022年12月4日
使用torch pruning工具进行结构化剪枝
摘要: 网络结构定义 import torch import torch.nn as nn import torch.nn.functional as F import torch_pruning as tp from torchvision.datasets import CIFAR10 from tor
阅读全文
posted @ 2022-12-04 21:56 牛犁heart
阅读(1398)
评论(0)
推荐(0)
Torch-Pruning工具箱
摘要: Torch-Pruning 通道剪枝网络实现加速的工作。 Torch pruning是进行结构剪枝的pytorch工具箱,和pytorch官方提供的基于mask的非结构化剪枝不同,工具箱移除整个通道剪枝,自动发现层与层剪枝的依赖关系,可以处理Densenet、ResNet和DeepLab 特性 卷积
阅读全文
posted @ 2022-12-04 18:47 牛犁heart
阅读(2785)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
···
42
下一页
公告