会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Dream
博客园
首页
新随笔
联系
管理
订阅
随笔- 249 文章- 0 评论- 85 阅读-
52万
2024年6月25日
视觉语言跨模态特征语义相似度计算改进--表征空间维度语义依赖感知聚合算法 ACM MM
摘要: 视觉语言跨模态特征语义相似度计算改进--表征空间维度语义依赖感知聚合算法 ACM MM
阅读全文
posted @ 2024-06-25 23:46 kkzhang
阅读(682)
评论(0)
推荐(0)
2024年1月15日
DPO: Direct Preference Optimization 直接偏好优化(学习笔记)
摘要: 学习参考:链接1 一、为什么要提出DPO 在之前,我们已经了解到基于人类反馈的强化学习RLHF分为三个阶段:全监督微调(SFT)、奖励模型(RM)、强化学习(PPO)。但是RLHF面临缺陷:RLHF 是一个复杂且经常不稳定的过程,首先拟合反映人类偏好的奖励模型,然后使用强化学习微调大型无监督 LM,
阅读全文
posted @ 2024-01-15 09:56 kkzhang
阅读(42998)
评论(0)
推荐(1)
2023年12月27日
Latex 公式 如何转为Word 公式,免费线上网站
摘要: 在实际中,我们常常需要讲将atex公式在word中书写。不采用手敲word公式,如何直接从Latex公式转word公式: 非常好的网站:https://www.latexlive.com/ 可以直接复制公式到word中粘贴,省去很大的负担!
阅读全文
posted @ 2023-12-27 21:36 kkzhang
阅读(7543)
评论(0)
推荐(2)
2023年12月13日
Python 知识点
摘要: 1、字格式化输出: .lower() 全部小写 .upper() 全部大写 .title() 各个字符的首字母大写 .capitalize() 首字母大写 .strip() 删除两边空格 .lstrip() 删除左边空格 .rstrip() 删除右边空格 .replace(" ","") 删除所有空
阅读全文
posted @ 2023-12-13 21:53 kkzhang
阅读(40)
评论(0)
推荐(0)
2023年11月20日
浮点数格式:FP64, FP32, FP16, BFLOAT16, TF32之间的相互区别
摘要: 浮点数格式 (参考1,参考2) 浮点数是一种用二进制表示的实数,它由三个部分组成:sign(符号位)、exponent(指数位)和fraction(小数位)。不同的浮点数格式有不同的位数分配给这三个部分,从而影响了它们能表示的数值范围和精度。例如: 下面是一些常见的浮点数格式的介绍: FP64(双精
阅读全文
posted @ 2023-11-20 10:08 kkzhang
阅读(16345)
评论(0)
推荐(1)
2023年11月13日
TRL(Transformer Reinforcement Learning) PPO Trainer 学习笔记
摘要: (1) PPO Trainer TRL支持PPO Trainer通过RL训练语言模型上的任何奖励信号。奖励信号可以来自手工制作的规则、指标或使用奖励模型的偏好数据。要获得完整的示例,请查看examples/notebooks/gpt2-sentiment.ipynb。Trainer很大程度上受到了原
阅读全文
posted @ 2023-11-13 15:44 kkzhang
阅读(3464)
评论(0)
推荐(0)
2023年11月9日
基于LoRA的RLHF
摘要: 参考Github 开源模型 LLM-Tuning 一、简介 (1)RLHF (基于人类反馈的强化学习) 分为三步: SFT (Supervised Fine-Tuning): 有监督的微调,使用正常的 instruction following 或者对话的样本,来训练模型的基础对话、听从 promp
阅读全文
posted @ 2023-11-09 16:03 kkzhang
阅读(2055)
评论(0)
推荐(0)
基于人类反馈的强化学习,Reinforcement Learning from Human Feedback (RLHF)
摘要: 基于人类反馈的强化学习, RLHF,转载参考链接 RLHF 是一项涉及多个模型和不同训练阶段的复杂概念,可以按三个步骤分解: 预训练一个语言模型 (LM) ; 聚合问答数据并训练一个奖励模型 (Reward Model,RM) ; 用强化学习 (RL) 方式微调 LM。 Step 1. 预训练语言模
阅读全文
posted @ 2023-11-09 10:39 kkzhang
阅读(2464)
评论(0)
推荐(1)
2022年7月22日
对比学习下的跨模态语义对齐是最优的吗?---自适应稀疏化注意力对齐机制 IEEE Trans. MultiMedia
摘要: 对比学习下的跨模态语义对齐是最优的吗?---自适应稀疏化注意力对齐机制 IEEE Trans. MultiMedia
阅读全文
posted @ 2022-07-22 20:01 kkzhang
阅读(2017)
评论(0)
推荐(0)
2022年7月21日
图像文本跨模态细粒度语义对齐-置信度校正机制 AAAI2022
摘要: (跨模态置信度感知的图像文本匹配网络)AAAI 2022
阅读全文
posted @ 2022-07-21 11:16 kkzhang
阅读(5837)
评论(16)
推荐(1)
下一页
<
2025年7月
>
日
一
二
三
四
五
六
29
30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
6
7
8
9
公告
昵称:
kkzhang
园龄:
8年7个月
粉丝:
81
关注:
6
+加关注
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
更多链接
我的标签
数据结构
(40)
Java
(36)
深度学习
(20)
数据库
(19)
SpringMVC
(16)
JavaWeb
(16)
MyBatis
(14)
论文阅读笔记
(12)
电路
(12)
Spring
(11)
凸优化和最优化算法
(10)
常用知识点
(10)
嵌入式
(8)
Linux
(7)
神经网络
(7)
更多
积分与排名
积分 - 224445
排名 - 5220
随笔档案
2024年6月(1)
2024年1月(1)
2023年12月(2)
2023年11月(4)
2022年7月(3)
2022年5月(1)
2022年1月(2)
2021年12月(2)
2021年5月(1)
2020年11月(3)
2020年10月(3)
2020年9月(1)
2020年8月(18)
2020年7月(8)
2020年6月(25)
2020年5月(99)
2020年4月(20)
2020年3月(12)
2020年2月(17)
2020年1月(2)
2019年5月(1)
2018年11月(2)
2018年10月(1)
2018年8月(3)
2018年7月(7)
2018年6月(7)
2018年4月(2)
更多
阅读排行榜
1. STM32单片机最小系统(56281)
2. STM32液晶显示HT1621驱动原理及程序代码(45276)
3. DPO: Direct Preference Optimization 直接偏好优化(学习笔记)(42995)
4. RS485 MODBUS RTU通信协议(36683)
5. 锂电池充电电路、锂电池充电保护电路(20943)
评论排行榜
1. 跨模态语义关联对齐检索-图像文本匹配(Image-Text Matching)CVPR2022(18)
2. 图像文本跨模态细粒度语义对齐-置信度校正机制 AAAI2022(16)
3. STM32液晶显示HT1621驱动原理及程序代码(12)
4. JDBC:批处理(9)
5. 利用MATLAB仿真节点个数和节点通信半径与网络连通率的关系(9)
推荐排行榜
1. 跨模态语义关联对齐检索-图像文本匹配(Image-Text Matching)CVPR2022(5)
2. Graph Neural Networks:谱域图卷积(3)
3. STM32单片机最小系统(3)
4. Latex 公式 如何转为Word 公式,免费线上网站(2)
5. [ 1 x 1 ] Convolution-1*1卷积的作用(2)
6. STM32液晶显示HT1621驱动原理及程序代码(2)
7. DPO: Direct Preference Optimization 直接偏好优化(学习笔记)(1)
8. 浮点数格式:FP64, FP32, FP16, BFLOAT16, TF32之间的相互区别(1)
9. 基于人类反馈的强化学习,Reinforcement Learning from Human Feedback (RLHF)(1)
10. 图像文本跨模态细粒度语义对齐-置信度校正机制 AAAI2022(1)
11. 最优化(1)
12. VS code 远程连接服务器步骤(1)
13. Pytorch 神经网络(1)
14. 经典的损失函数:交叉熵和MSE(1)
15. 问题:CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://mirrors.tuna.tsinghua.edu.cn/anaconda/pk(1)
16. 事务@Transactional注解的属性(1)
17. 声明式事务管理(1)
18. 程序、进程、线程(1)
19. 树的存储结构(1)
20. 模电Multisim仿真Rb变化对Q点和电压放大倍数的影响(1)
21. LEACH分簇算法实现和能量控制算法实现(1)
22. LM431精密+3.3V产生电路(1)
23. 锂电池充电电路、锂电池充电保护电路(1)
最新评论
1. Re:温湿度监测系统-使用说明书
可以学习一下源码吗419011851@qq.com
--Non_Nougat
2. Re:Graph Neural Networks:谱域图卷积
@linksion 你好,这篇博客的学习内容主要是听中科院计算所沈华伟老师的视频课【1】,可以在B站上搜到很多。如果想系统性学习的话,建议看一下沈老师组的综述:《图卷积神经网络综述》【2】,但实际上,...
--kkzhang
3. Re:Graph Neural Networks:谱域图卷积
请问博文里的图片来自于哪里,是视频里的吗,我想系统学下图网络,很需要视频课。另外你的这篇博文质量很高,对我帮助很大
--linksion
4. Re:Graph Neural Networks:谱域图卷积
@crss2457 哈哈哈感谢~...
--kkzhang
5. Re:Graph Neural Networks:谱域图卷积
专门注册账号来点赞和评论
--crss2457
点击右上角即可分享