会员
众包
新闻
博问
闪存
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Loading
SunStriKE's Blog
博客园
首页
新随笔
联系
订阅
管理
2024年6月17日
cuda程序优化-3.通信简介
摘要: GPU进行卡间通信/多机通信的算法简介
阅读全文
posted @ 2024-06-17 19:56 SunStriKE
阅读(3)
评论(0)
推荐(0)
编辑
cuda程序优化-2.访存优化
摘要: 在CUDA程序中, 访存优化个人认为是最重要的优化项. 往往kernel会卡在数据传输而不是计算上, 为了最大限度利用GPU的计算能力, 我们需要根据GPU硬件架构对kernel访存进行合理的编写.
阅读全文
posted @ 2024-06-17 15:31 SunStriKE
阅读(99)
评论(0)
推荐(0)
编辑
2024年6月6日
CUDA程序优化-1.基础介绍
摘要: 介绍CUDA的基本概念和架构,帮助读者建立对CUDA的初步认识,包括硬件架构/CUDA基础等内容
阅读全文
posted @ 2024-06-06 19:49 SunStriKE
阅读(46)
评论(0)
推荐(0)
编辑
2023年9月5日
Paddle图神经网络训练-PGLBox代码阅读笔记
摘要: Paddle图神经网络训练, PGLBox代码阅读笔记, 主要为核心GPU游走相关逻辑, 分布式训练部分后续补充.
阅读全文
posted @ 2023-09-05 20:04 SunStriKE
阅读(274)
评论(0)
推荐(0)
编辑
2023年3月29日
AutoEmbedding论文阅读笔记
摘要: 推荐系统中对embedding维度进行自动调优的常见方法 阅读笔记.
阅读全文
posted @ 2023-03-29 12:57 SunStriKE
阅读(55)
评论(0)
推荐(0)
编辑
2023年3月24日
DesignPattern-part2
摘要: 现代c++设计模式 part2 桥接,适配器,装饰器
阅读全文
posted @ 2023-03-24 19:22 SunStriKE
阅读(19)
评论(0)
推荐(0)
编辑
DesignPattern-part1
摘要: 现代c++设计模式 part1 工厂模式,建造者模式与单例模式的现代实现
阅读全文
posted @ 2023-03-24 19:21 SunStriKE
阅读(22)
评论(0)
推荐(0)
编辑
DesignPattern-part3
摘要: 结构式设计模式 享元模式:实现对象共享,减少内存开销; 代理模式,提供相同接口的代理
阅读全文
posted @ 2023-03-24 19:20 SunStriKE
阅读(31)
评论(0)
推荐(0)
编辑
Deep Transfer Learning综述阅读笔记
摘要: 深度迁移学习综述, 里面讲了一些对于search/recommend system中的迁移学习应用
阅读全文
posted @ 2023-03-24 18:49 SunStriKE
阅读(46)
评论(0)
推荐(0)
编辑
2023年3月16日
cpu分布式训练论文阅读
摘要: Large Scale Distributed Deep Networks Downpour SGD: 模型的副本采用异步方式从参数服务器(Parameter Server)中获取参数w和上传Δw到参数服务器 模型副本之间运行独立 参数服务器组各节点之间同样是独立的 优点: 同步SGD: 如果一台机
阅读全文
posted @ 2023-03-16 13:23 SunStriKE
阅读(66)
评论(0)
推荐(0)
编辑
下一页
公告