会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
33
34
35
36
37
38
39
40
41
···
154
下一页
2025年3月22日
FlowMo: 模式搜索+扩散模型提升图像Token化性能
摘要: 自VQGAN和Latent Diffusion Models等视觉生成框架问世以来,先进的图像生成系统通常采用两阶段架构:首先将视觉数据Token化或压缩至低维潜在空间,随后学习生成模型。传统Token化器训练遵循标准范式,通过MSE、感知损失和对抗性损失的组合约束来实现图像压缩与重建。虽然扩散自编
阅读全文
posted @ 2025-03-22 10:02 deephub
阅读(51)
评论(0)
推荐(0)
2025年3月21日
SEARCH-R1: 基于强化学习的大型语言模型多轮搜索与推理框架
摘要: 这个研究提出了一种新型强化学习(RL)框架SEARCH-R1,该框架使大型语言模型(LLM)能够实现多轮、交错的搜索与推理能力集成。不同于传统的检索增强生成(RAG)或工具使用方法,SEARCH-R1通过强化学习训练LLM自主生成查询语句,并优化其基于搜索引擎结果的推理过程。 该模型的核心创新在于完
阅读全文
posted @ 2025-03-21 10:15 deephub
阅读(196)
评论(0)
推荐(0)
2025年3月20日
生成AI的两大范式:扩散模型与Flow Matching的理论基础与技术比较
摘要: 生成模型已成为人工智能领域的关键突破,赋予机器创建高度逼真的图像、音频和文本的能力。在众多生成技术中,扩散模型和Flow Matching尤为引人注目。这两种方法虽然都致力于在噪声与结构化数据之间建立转换,但其基础原理存在本质区别。本文将系统地比较这两种先进技术,深入探讨其数学原理、实际应用及理论解
阅读全文
posted @ 2025-03-20 10:14 deephub
阅读(362)
评论(0)
推荐(0)
2025年3月19日
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
摘要: 在深度学习的背景下,NVIDIA的CUDA与AMD的ROCm框架缺乏有效的互操作性,导致基础设施资源利用率显著降低。随着模型规模不断扩大而预算约束日益严格,2-3年更换一次GPU的传统方式已不具可持续性。但是Pytorch的最近几次的更新可以有效利用异构计算集群,实现对所有可用GPU资源的充分调度,
阅读全文
posted @ 2025-03-19 11:07 deephub
阅读(43)
评论(0)
推荐(0)
2025年3月18日
GoT:基于思维链的语义-空间推理框架为视觉生成注入思维能力
摘要: 文探讨GoT框架如何通过语义-空间思维链方法提升图像生成的精确性与一致性 计算机视觉领域正经历一次技术革新:一种不仅能将文本转换为图像,还能在生成过程中实施结构化推理的系统。这一系统即为GoT(Generative Thoughts of Thinking,生成式思维链)框架——一种将显式推理机制引
阅读全文
posted @ 2025-03-18 09:54 deephub
阅读(93)
评论(0)
推荐(0)
2025年3月17日
RAG-Gym: 基于过程监督的检索增强生成代理优化框架
摘要: 传统检索增强生成(RAG)架构因依赖静态检索机制,在处理需要顺序信息搜索的复杂问题时存在效能限制。尽管基于代理的推理与搜索方法提供了更具适应性的解决方案,但现有方法大多过度依赖提示工程技术。 针对上述挑战,本文介绍了RAG-Gym框架,这是一种通过在搜索过程中实施细粒度过程监督来增强信息搜索代理的统
阅读全文
posted @ 2025-03-17 10:06 deephub
阅读(67)
评论(0)
推荐(0)
2025年3月16日
MiTS与PoTS:面向连续值时间序列的极简Transformer架构
摘要: 原始"Attention Is All You Need"论文中提出的标准Transformer架构最初设计用于处理离散输入和输出序列标记(token),但将其应用于时间序列分析时,需要对模型结构进行适当调整以适应连续数据特性。本文详细阐述了使原始Transformer架构能够高效处理连续值时间序列
阅读全文
posted @ 2025-03-16 10:29 deephub
阅读(40)
评论(0)
推荐(0)
2025年3月15日
信息检索系统评估指标的层级分析:从单点精确度到整体性能度量
摘要: 在构建搜索引擎系统时,有效的评估机制是保证系统质量的关键环节。当用户输入查询词如"machine learning tutorials python",系统返回结果列表后,如何客观评估这些结果的相关性和有效性?这正是信息检索评估指标的核心价值所在。 分析用户与搜索引擎的交互模式,我们可以观察到以下行
阅读全文
posted @ 2025-03-15 10:17 deephub
阅读(54)
评论(0)
推荐(0)
2025年3月14日
PyTorch PINN实战:用深度学习求解微分方程
摘要: 神经网络技术已在计算机视觉与自然语言处理等多个领域实现了突破性进展。然而在微分方程求解领域,传统神经网络因其依赖大规模标记数据集的特性而表现出明显局限性。物理信息神经网络(Physics-Informed Neural Networks, PINN)通过将物理定律直接整合到学习过程中,有效弥补了这一
阅读全文
posted @ 2025-03-14 10:08 deephub
阅读(321)
评论(0)
推荐(0)
2025年3月13日
时间序列特征提取:18 种高效工具库及其应用分析
摘要: 时间序列特征提取是数据科学工作流程中的关键环节,能够将原始时间序列数据转化为具有分析价值的特征表示。本文详细介绍 18 种专业的 Python 库,这些库可用于从时间序列数据中提取关键特征,支持数据科学家进行更深入的分析与建模。 时间序列特征提取的理论基础与价值 时间序列特征是对时间序列数据的统计量
阅读全文
posted @ 2025-03-13 14:43 deephub
阅读(87)
评论(0)
推荐(0)
上一页
1
···
33
34
35
36
37
38
39
40
41
···
154
下一页
公告