会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
10
11
12
13
14
15
16
17
18
···
139
下一页
2025年6月18日
Adaptive-k 检索:RAG 系统中自适应上下文长度选择的新方法
摘要: 本文介绍 Adaptive-k 检索技术,这是一种通过相似性分布分析动态确定最优上下文规模的即插即用方法,该技术在显著降低 token 消耗的同时实现了检索增强生成系统的性能提升。 在检索增强生成(RAG)技术快速发展的当前阶段,一个核心问题始终困扰着研究人员和工程师:如何确定最优的上下文长度? 上
阅读全文
posted @ 2025-06-18 10:43 deephub
阅读(22)
评论(0)
推荐(0)
2025年6月17日
基于时间图神经网络多的产品需求预测:跨序列依赖性建模实战指南
摘要: 本文从理论基础出发深入探讨图神经网络(Graph Neural Networks, GNNs)及以供应链需求预测为应用场景在多产品日销售量预测中的应用。在相关SKU构成的复杂网络中,单一产品的销售波动往往会对其他产品产生连锁影响。本文展示了如何通过学习稀疏影响图、应用图卷积融合邻居节点信息,并结合时
阅读全文
posted @ 2025-06-17 10:36 deephub
阅读(32)
评论(0)
推荐(0)
2025年6月16日
解决RAG检索瓶颈:RAPL线图转换让知识图谱检索准确率提升40%
摘要: 本文深入探讨RAPL(Retrieval-Augmented Path Learning)框架,这是一个创新的人工智能架构,通过线图转换和合理化监督技术,从根本上改进了知识图谱环境下的检索增强生成系统。该框架通过构建高效且可泛化的检索器,显著提升了大型语言模型在知识问答任务中的准确性和可解释性。 当
阅读全文
posted @ 2025-06-16 09:59 deephub
阅读(35)
评论(0)
推荐(0)
2025年6月15日
ProRL:基于长期强化学习让1.5B小模型推理能力超越7B大模型
摘要: 这个研究挑战了强化学习仅能放大现有模型输出能力的传统观点,通过实验证明长期强化学习训练(ProRL)能够使基础模型发现全新的推理策略。ProRL方法体系包含KL散度控制机制、参考策略重置技术以及多元化任务训练集。 ProRL核心方法论 基于GRPO的强化学习算法 ProRL采用组相对策略优化(Gro
阅读全文
posted @ 2025-06-15 10:26 deephub
阅读(27)
评论(0)
推荐(0)
2025年6月14日
PyTorch + MLFlow 实战:从零构建可追踪的深度学习模型训练系统
摘要: 本文通过使用 Kaggle 数据集训练情感分析模型的实例,详细演示了如何将 PyTorch 与 MLFlow 进行深度集成,实现完整的实验跟踪、模型记录和结果可复现性管理。文章将系统性地介绍训练代码的核心组件,展示指标和工件的记录方法,并提供 MLFlow UI 的详细界面截图。 无论您是初次接触
阅读全文
posted @ 2025-06-14 08:53 deephub
阅读(26)
评论(0)
推荐(0)
2025年6月13日
Python 3D数据可视化:7个实用案例助你快速上手
摘要: 在多变量数据分析中,涉及三个变量的数据可视化往往需要采用三维绘图技术,以便更全面地理解和分析在二维表示中难以清晰呈现的复杂关系和数据模式。 Python 的 Matplotlib 库通过其 mpl_toolkits.mplot3d 工具包,为复杂三维可视化的生成提供了强大的功能支持。构建三维图形的基
阅读全文
posted @ 2025-06-13 14:01 deephub
阅读(31)
评论(0)
推荐(0)
2025年6月12日
数据分布不明确?5个方法识别数据分布,快速找到数据的真实规律
摘要: 在数据科学项目中,数据预处理阶段往往决定着后续分析的质量和模型的性能。但是分布识别这一关键步骤经常被从业者忽视。在构建预测模型或执行假设检验之前,正确识别数据的潜在分布特征是确保分析结果可靠性的基础工作。 数据分析的成功很大程度上取决于对数据特征的准确理解。正如在工程项目中需要根据不同的环境条件选择
阅读全文
posted @ 2025-06-12 14:33 deephub
阅读(20)
评论(0)
推荐(0)
2025年6月11日
SnapViewer:解决PyTorch官方内存工具卡死问题,实现高效可视化
摘要: 在深度学习模型训练过程中,GPU内存不足(Out of Memory, OOM)错误是开发者频繁遇到的技术挑战。传统的解决方案如减少批量大小虽然简单有效,但当这些基础优化手段无法满足需求时,就需要对模型的内存分配模式进行深入分析。 PyTorch提供了内存分析工具,通过官方文档可以学习如何记录内存快
阅读全文
posted @ 2025-06-11 10:04 deephub
阅读(23)
评论(0)
推荐(0)
2025年6月10日
提升长序列建模效率:Mamba+交叉注意力架构完整指南
摘要: 本文将深入分析Mamba架构中交叉注意力机制的集成方法与技术实现。Mamba作为一种基于选择性状态空间模型的新型序列建模架构,在长序列处理方面展现出显著的计算效率优势。通过引入交叉注意力机制,Mamba能够有效处理多模态信息融合和条件生成任务。本文从理论基础、技术实现、性能分析和应用场景等维度,全面
阅读全文
posted @ 2025-06-10 10:29 deephub
阅读(47)
评论(0)
推荐(0)
2025年6月9日
LangGraph实战教程:构建会思考、能记忆、可人工干预的多智能体AI系统
摘要: 通过组合几个较小的子智能体来创建强大的 AI 智能体已成为一种趋势。但这也带来了挑战,例如减少幻觉、管理对话流程、在测试期间密切关注智能体的工作方式、允许人工介入以及评估其性能。你需要进行大量的反复试验。 在本文中,我们将使用监督者方法构建一个多智能体系统。在此过程中,我们将介绍基础知识、在创建复杂
阅读全文
posted @ 2025-06-09 12:31 deephub
阅读(84)
评论(0)
推荐(0)
上一页
1
···
10
11
12
13
14
15
16
17
18
···
139
下一页
公告