会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
6
7
8
9
10
11
12
13
14
···
139
下一页
2025年7月28日
搜索结果太乱?5种重排序模型让你的搜索系统准确率提升40%
摘要: 在构建企业级搜索引擎时,工程师们经常面临这样的挑战:初始检索系统虽然能够返回大量潜在相关文档(通常在1000个左右),但真正符合用户需求的高质量结果往往被淹没在海量数据中,可能散布在结果列表的任意位置。这种现象在现代搜索引擎、推荐系统以及检索增强生成(RAG)应用中普遍存在,严重影响了用户体验和系统
阅读全文
posted @ 2025-07-28 18:54 deephub
阅读(30)
评论(0)
推荐(0)
2025年7月27日
LLM开发者必备:掌握21种分块策略让RAG应用性能翻倍
摘要: 检索增强生成(Retrieval-Augmented Generation, RAG)是当前AI工程师在实际应用中面临的重要技术挑战之一。从理论角度来看,RAG的工作原理相对直观:从自定义数据源中检索相关上下文,然后基于这些上下文让大语言模型生成对应的回答。 在实际部署过程中,开发者往往需要处理大量
阅读全文
posted @ 2025-07-27 19:03 deephub
阅读(12)
评论(0)
推荐(0)
2025年7月26日
AI代理性能提升实战:LangChain+LangGraph内存管理与上下文优化完整指南
摘要: 在AI代理系统的开发过程中,上下文工程已成为决定系统性能的关键技术。上下文工程本质上是在为AI系统分配任务之前建立合适的执行环境,这个环境需要包含明确的行为指令(如配置AI充当专业的预算旅行顾问)、来自数据库、文档或实时数据源的有用信息访问权限、对历史对话的记忆能力以避免信息重复或遗忘、可供AI调用
阅读全文
posted @ 2025-07-26 18:49 deephub
阅读(63)
评论(0)
推荐(0)
2025年7月25日
2025年AI智能体开发完全指南:10个GitHub顶级教程资源助你从入门到精通
摘要: 人工智能智能体(AI Agents)作为当前AI领域最具前沿性的技术方向,正在推动着自动化决策、多模态交互和复杂任务执行的革命性发展。本文精选了十个高质量的GitHub开源项目,涵盖从基础理论到实践应用的全方位学习路径,为AI开发者提供系统性的技术资源。 1、Hands-On Large Langu
阅读全文
posted @ 2025-07-25 16:59 deephub
阅读(35)
评论(0)
推荐(0)
2025年7月24日
DGMR压缩技术:让大规模视觉Transformer模型体积减半而性能不减
摘要: Transformer架构展现出卓越的扩展特性,其性能随模型容量增长而持续提升。大规模模型在获得优异性能的同时,也带来了显著的计算和存储开销。深入分析主流Transformer架构发现,多层感知器(MLP)模块占据了模型参数的主要部分,这为模型压缩提供了重要切入点。 针对这一问题,研究者提出了多样性
阅读全文
posted @ 2025-07-24 21:54 deephub
阅读(23)
评论(0)
推荐(0)
2025年7月23日
Google DeepMind发布MoR架构:50%参数超越传统Transformer,推理速度提升2倍
摘要: 自2017年Vaswani等人发表"Attention Is All You Need"以来,Transformer架构已成为现代自然语言处理和人工智能系统的核心基础,为GPT、BERT、PaLM和Gemini等大型语言模型提供了强有力的技术支撑。然而,随着模型规模的不断扩大和任务复杂性的持续增长,
阅读全文
posted @ 2025-07-23 19:16 deephub
阅读(82)
评论(0)
推荐(0)
2025年7月22日
从零构建智能对话助手:LangGraph + ReAct 实现具备记忆功能的 AI 智能体
摘要: 随着人工智能技术的快速发展,构建能够自主推理和执行复杂任务的智能体系统已成为当前研究的热点。ReAct(Reasoning + Action)智能体作为一种突破性的架构模式,成功地将语言模型的推理能力与外部工具的行动能力有机结合,为解决复杂的现实世界问题提供了新的技术路径。 在传统的语言模型应用中,
阅读全文
posted @ 2025-07-22 19:40 deephub
阅读(57)
评论(0)
推荐(0)
2025年7月21日
最大熵逆强化学习:理论基础、数学推导与工程实现
摘要: 模仿学习(Imitation Learning, IL)旨在从给定的专家演示数据中提取决策策略。该方法适用于各类自动化任务,尤其在控制领域应用广泛。本文重点讨论逆强化学习(Inverse Reinforcement Learning, IRL),这是模仿学习的重要分支,其核心目标是基于演示数据学习能
阅读全文
posted @ 2025-07-21 19:43 deephub
阅读(32)
评论(0)
推荐(0)
2025年7月20日
从零搭建智能搜索代理:LangGraph + 实时搜索 + PDF导出完整项目实战
摘要: 传统的AI聊天系统往往局限于预训练数据的知识范围,无法获取实时信息。本文将详细阐述如何构建一个基于LangGraph的智能代理系统,该系统能够智能判断何时需要进行网络搜索、有效维护对话上下文,并具备将对话内容导出为PDF文档的功能。 本系统的核心特性包括:基于智能判断机制的自动网络搜索触发、跨多轮对
阅读全文
posted @ 2025-07-20 18:26 deephub
阅读(33)
评论(0)
推荐(0)
2025年7月19日
GQNN框架:让Python开发者轻松构建量子神经网络
摘要: 随着人工智能技术的快速发展,其计算复杂性需求也在不断提升。传统的经典神经网络在图像识别、自然语言处理等领域取得了显著成就,然而在处理指数级规模数据集或高度纠缠的复杂问题空间时,受限于经典计算的本质局限性,其性能增长逐渐趋于瓶颈。量子神经网络(Quantum Neural Networks, QNNs
阅读全文
posted @ 2025-07-19 21:15 deephub
阅读(33)
评论(0)
推荐(0)
上一页
1
···
6
7
8
9
10
11
12
13
14
···
139
下一页
公告