会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
happyyoung's blog
首页
管理
上一页
1
···
12
13
14
15
16
17
18
19
20
···
37
下一页
2019年6月19日
Is Search Really Necessary to Generate High-Performance BLAS
摘要: 搜索对于生成高性能BLAS真的必要吗? 程序优化的一个关键步骤是评估参数的最优值,例如tile sizes和loop unrolling factors(循环展开因子)。传统编译器使用分析模型来计算这些值,而ATLAS库则在参数的取值空间中进行全局搜索,得到不同的取值组合,再在真实硬件上运行,以此决
阅读全文
posted @ 2019-06-19 15:31 happyyoung
阅读(165)
评论(0)
推荐(0)
2019年6月17日
AI TensorRT
摘要: 参考链接 https://docs.nvidia.com/deeplearning/sdk/tensorrt-developer-guide/index.html
阅读全文
posted @ 2019-06-17 10:53 happyyoung
阅读(177)
评论(0)
推荐(0)
2019年6月11日
AI OpenVINO
摘要: 部署挑战 1、把训练环境的深度学习网络部署到嵌入式平台做推理,会有些技术挑战要解决。 1)工业界有很多深度学习框架,如Caffe,TensorFlow,MXNet,Kaldi等等。 2)训练是在数据中心或服务器集群。而推理是在嵌入式平台(经过性能和耗电优化),这些平台在软件(编程语言,第三方依赖,内
阅读全文
posted @ 2019-06-11 15:32 happyyoung
阅读(406)
评论(0)
推荐(0)
gRPC
摘要: gRPC是高性能 参考链接 https://grpc.io/
阅读全文
posted @ 2019-06-11 13:27 happyyoung
阅读(123)
评论(0)
推荐(0)
2019年6月7日
AI tensorflow模型格式
摘要: tensorflow模型可以利用tf.train.Saver类保存成文件。一个模型包含下面四个文件。 meta文件 存储计算图的protobuf。 data-00000-of-00001文件和index文件 存储权值和偏置的二进制文件。 checkpoint文件 存储模型checkpoint信息的文
阅读全文
posted @ 2019-06-07 16:16 happyyoung
阅读(735)
评论(0)
推荐(0)
2019年5月28日
AI CUDA
摘要: 9.0版本的变更 1)__global__函数不能重载。 2) 3) 4)CUDA环境变量增加CUDA_ENABLE_CRC_CHECK。 5)扭曲矩阵函数支持矩阵乘积:m=32, n=8, k=16;m=8, n=32, k=16;m=n=k=16。 6)增加新的统一内存节:系统分配器,硬件相干性
阅读全文
posted @ 2019-05-28 20:41 happyyoung
阅读(301)
评论(0)
推荐(0)
AI opencv
摘要: Mat cv::imread(const String & filename, int flags = IMREAD_COLOR) imwrite(filename, img[, params]) cvtColor(src, code[, dst[, dstCn]]) resize(src, dsi
阅读全文
posted @ 2019-05-28 13:07 happyyoung
阅读(276)
评论(0)
推荐(0)
AI numpy
摘要: numpy.concatenate((a1, a2, ...), axis=0, out=None) nan:not a number inf:infinate arange(start, stop, step):[start, stop),step是步长的数组 sin:正弦函数 cos:余弦函数
阅读全文
posted @ 2019-05-28 11:21 happyyoung
阅读(144)
评论(0)
推荐(0)
2019年5月27日
AI DeblurGAN
摘要: 论文:https://arxiv.org/pdf/1711.07064.pdf 译文:使用条件对抗网络消除盲目运动导致的模糊 摘要 我们提出DeblurGAN,一种用于运动去模糊化的端到端的学习方法。这种学习基于条件对抗网络和内容损失。模型、代码和数据集都放在https://github.com/K
阅读全文
posted @ 2019-05-27 21:39 happyyoung
阅读(535)
评论(0)
推荐(0)
AI ResNet V1
摘要: 论文:https://arxiv.org/pdf/1512.03385.pdf 译文:用于图像识别的深度残差学习 摘要 越深的神经网络就越难训练。我们提出一种残差学习框架,来简化比之前深很多的网络的训练。 恒等映射(identity mapping)
阅读全文
posted @ 2019-05-27 21:02 happyyoung
阅读(138)
评论(0)
推荐(0)
上一页
1
···
12
13
14
15
16
17
18
19
20
···
37
下一页
公告