会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
18
19
20
21
22
23
24
25
26
···
139
下一页
2025年3月28日
SWEET-RL:基于训练时信息的多轮LLM代理强化学习框架
摘要: SWEET-RL(Step-WisE Evaluation from Training-time information,基于训练时信息的逐步评估)是多轮大型语言模型(LLM)代理强化学习领域的重要技术进展。该算法相较于现有最先进的方法,成功率提升了6%,使Llama-3.1-8B等小型开源模型能够
阅读全文
posted @ 2025-03-28 09:48 deephub
阅读(79)
评论(0)
推荐(0)
2025年3月27日
时间序列异常检测:MSET-SPRT组合方法的原理和Python代码实现
摘要: 在异常检测领域,尤其针对工业机械、核反应堆和网络安全等复杂系统,传统方法往往难以有效处理高维度且相互关联的数据流。多元状态估计技术(MSET) 与序贯概率比检验(SPRT) 的组合方法在此类场景中展现出显著优势。 MSET-SPRT是一种结合机器学习状态估计与统计假设检验的混合技术框架,通过其高精度
阅读全文
posted @ 2025-03-27 10:24 deephub
阅读(64)
评论(0)
推荐(0)
2025年3月26日
RAL-Writer Agent:基于检索与复述机制,让长文创作不再丢失关键信息
摘要: RAL-Writer Agent是一种专业的人工智能写作辅助技术,旨在解决生成高质量、内容丰富的长篇文章时所面临的技术挑战,确保全文保持连贯性和相关性。本研究将系统分析RAL-Writer的核心技术架构、功能特点及其在内容创作、学术研究和专业交流领域的应用前景。 长文本生成的技术挑战 当前数字环境下
阅读全文
posted @ 2025-03-26 10:21 deephub
阅读(41)
评论(0)
推荐(0)
2025年3月25日
分位数回归+共形预测:Conformalized Quantile Regression实现更可靠的预测区间
摘要: 预测不确定性量化在数据驱动决策过程中具有关键作用。无论是评估医疗干预的风险概率还是预测金融市场的价格波动范围,我们常需要构建预测区间——即以特定置信度包含目标真值的概率区间。 **分位数回归(Quantile Regression, QR)**作为一种传统统计方法,长期以来被用于预测此类区间。与常规
阅读全文
posted @ 2025-03-25 10:17 deephub
阅读(138)
评论(0)
推荐(0)
2025年3月24日
SANA-Sprint:基于连续时间一致性蒸馏的单步扩散模型,0.1秒即可生成图像
摘要: 扩散模型已成为现代文本到图像 (T2I) 生成技术的核心,能够生成高质量图像,但其迭代式推理过程导致生成速度缓慢。多数模型通常需要 20–50 个去噪步骤,这严重制约了其在实时应用中的部署。 现有的蒸馏技术旨在加速扩散模型的采样过程,然而,这些方法往往会引入稳定性问题,在极低步数下出现质量下降,并可
阅读全文
posted @ 2025-03-24 10:13 deephub
阅读(59)
评论(0)
推荐(0)
2025年3月23日
广义优势估计(GAE):端策略优化PPO中偏差与方差平衡的关键技术
摘要: 广义优势估计(Generalized Advantage Estimation, GAE)由Schulman等人在2016年的论文中提出,是近端策略优化(PPO)算法的重要基础理论,也是促使PPO成为高效强化学习算法的核心因素之一。 GAE的理论基础建立在资格迹(eligibility traces
阅读全文
posted @ 2025-03-23 11:00 deephub
阅读(278)
评论(0)
推荐(0)
2025年3月22日
FlowMo: 模式搜索+扩散模型提升图像Token化性能
摘要: 自VQGAN和Latent Diffusion Models等视觉生成框架问世以来,先进的图像生成系统通常采用两阶段架构:首先将视觉数据Token化或压缩至低维潜在空间,随后学习生成模型。传统Token化器训练遵循标准范式,通过MSE、感知损失和对抗性损失的组合约束来实现图像压缩与重建。虽然扩散自编
阅读全文
posted @ 2025-03-22 10:02 deephub
阅读(31)
评论(0)
推荐(0)
2025年3月21日
SEARCH-R1: 基于强化学习的大型语言模型多轮搜索与推理框架
摘要: 这个研究提出了一种新型强化学习(RL)框架SEARCH-R1,该框架使大型语言模型(LLM)能够实现多轮、交错的搜索与推理能力集成。不同于传统的检索增强生成(RAG)或工具使用方法,SEARCH-R1通过强化学习训练LLM自主生成查询语句,并优化其基于搜索引擎结果的推理过程。 该模型的核心创新在于完
阅读全文
posted @ 2025-03-21 10:15 deephub
阅读(144)
评论(0)
推荐(0)
2025年3月20日
生成AI的两大范式:扩散模型与Flow Matching的理论基础与技术比较
摘要: 生成模型已成为人工智能领域的关键突破,赋予机器创建高度逼真的图像、音频和文本的能力。在众多生成技术中,扩散模型和Flow Matching尤为引人注目。这两种方法虽然都致力于在噪声与结构化数据之间建立转换,但其基础原理存在本质区别。本文将系统地比较这两种先进技术,深入探讨其数学原理、实际应用及理论解
阅读全文
posted @ 2025-03-20 10:14 deephub
阅读(306)
评论(0)
推荐(0)
2025年3月19日
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
摘要: 在深度学习的背景下,NVIDIA的CUDA与AMD的ROCm框架缺乏有效的互操作性,导致基础设施资源利用率显著降低。随着模型规模不断扩大而预算约束日益严格,2-3年更换一次GPU的传统方式已不具可持续性。但是Pytorch的最近几次的更新可以有效利用异构计算集群,实现对所有可用GPU资源的充分调度,
阅读全文
posted @ 2025-03-19 11:07 deephub
阅读(20)
评论(0)
推荐(0)
上一页
1
···
18
19
20
21
22
23
24
25
26
···
139
下一页
公告