deephub

2025年4月25日

SecMulti-RAG：兼顾数据安全与智能检索的多源RAG框架，为企业构建不泄密的智能搜索引擎

摘要：本文深入剖析SecMulti-RAG框架，该框架通过集成内部文档库、预构建专家知识以及受控外部大语言模型，并结合保密性过滤机制，为企业提供了一种平衡信息准确性、完整性与数据安全性的RAG解决方案，同时有效控制部署成本。企业环境中AI助手的机遇与挑战企业级AI助手的潜力正在迅速显现——一种能够无缝阅读全文

posted @ 2025-04-25 16:47 deephub 阅读(26) 评论(0) 推荐(0)

2025年4月24日

KG4MM：融合知识图谱与多模态数据预测药物相互作用

摘要：知识图谱（Knowledge Graph, KG）作为表示不同实体间复杂关系的有效工具，已得到广泛应用。通过将信息编码为节点（实体）和边（关系），知识图谱简化了关联信息的追踪与分析。用于多模态学习的知识图谱（Knowledge Graphs for Multimodal Learning, KG4M 阅读全文

posted @ 2025-04-24 13:50 deephub 阅读(51) 评论(0) 推荐(0)

2025年4月23日

CLIMB自举框架：基于语义聚类的迭代数据混合优化及其在LLM预训练中的应用

摘要：尽管优化预训练数据混合对大型语言模型(LLM)的性能有显著影响，但确定最优数据配比仍然是一个亟待解决的挑战。为应对这一问题，英伟达提出了一种名为CLIMB(CLustering-based Iterative data Mixture Bootstrapping)的自动化框架，该框架能够在预训练环境阅读全文

posted @ 2025-04-23 11:38 deephub 阅读(47) 评论(0) 推荐(0)

2025年4月22日

10招立竿见影的PyTorch性能优化技巧，让模型训练速度翻倍

摘要： PyTorch作为深度学习研究与工程领域的主流框架，拥有强大的性能潜力，但许多高级性能特性往往隐藏在文档深处，未被充分利用。本文基于对多种模型架构、不同PyTorch版本和容器环境的实证测试，系统总结了PyTorch性能调优的关键技术，旨在帮助开发者构建高效、可扩展的深度学习应用。 https:// 阅读全文

posted @ 2025-04-22 10:42 deephub 阅读(110) 评论(0) 推荐(0)

2025年4月21日

SmolVLM：资源受限环境下的高效多模态模型研究

摘要： SmolVLM是专为资源受限设备设计的一系列小型高效多模态模型。尽管模型规模较小，但通过精心设计的架构和训练策略，SmolVLM在图像和视频处理任务上均表现出接近大型模型的性能水平，为实时、设备端应用提供了强大的视觉理解能力。 SmolVLM架构设计该研究系统性地探索了小型多模态模型的设计选择与权阅读全文

posted @ 2025-04-21 13:00 deephub 阅读(87) 评论(0) 推荐(0)

2025年4月20日

从零开始用Pytorch实现LLaMA 4的混合专家（MoE）模型

摘要：近期发布的LLaMA 4模型引入了混合专家（Mixture of Experts, MoE）架构，旨在提升模型效率和性能。尽管社区对LLaMA 4的实际表现存在一些讨论，但MoE作为一种重要的模型设计范式，继Mistral等模型之后再次受到关注。所以我们将使用Pytorch逐步从零开始实现一个简化版阅读全文

posted @ 2025-04-20 10:52 deephub 阅读(60) 评论(0) 推荐(0)

2025年4月19日

ReSearch：基于强化学习的大语言模型推理搜索框架

摘要： ReSearch是一种创新性框架，通过强化学习技术训练大语言模型执行"推理搜索"，无需依赖推理步骤的监督数据。该方法将搜索操作视为推理链的有机组成部分，其中搜索的时机与方式由基于文本的推理过程决定，而搜索结果进一步引导后续推理。研究分析表明，ReSearch在强化学习训练过程中自然地形成了高级推理能阅读全文

posted @ 2025-04-19 14:44 deephub 阅读(17) 评论(0) 推荐(0)

2025年4月18日

2025年GitHub平台上的十大开源MCP服务器汇总分析

摘要：随着人工智能生态系统的迅速演进，模型与工具之间的无缝通信已成为技术发展的关键环节。在这一背景下，模型上下文协议（Model Context Protocol，MCP）服务器正日益凸显其战略价值。这些服务器作为连接AI与现实世界的技术桥梁，实现了人工智能模型与现实应用程序、API接口、数据库及自动化工阅读全文

posted @ 2025-04-18 09:50 deephub 阅读(160) 评论(0) 推荐(0)

2025年4月17日

Crawl4AI：为大语言模型打造的开源网页数据采集工具

摘要：随着大型语言模型(LLMs)的快速发展，高质量数据供给已成为智能系统的关键基础架构。为使人工智能系统能够生成有实际价值的分析结果，它需要获取及时、结构化且相关性高的数据源。如Crawl4AI这类工具正在革新数据获取与传递机制，使大语言模型能够动态接入多样化数据源，而无需受限于固定API接口的约束。阅读全文

posted @ 2025-04-17 09:54 deephub 阅读(71) 评论(0) 推荐(0)

2025年4月16日

Triton入门教程：安装与编写和运行简单Triton内核

摘要： Triton是一款开源的GPU编程语言与编译器，为AI和深度学习领域提供了高性能GPU代码的高效开发途径。本指南将全面阐述Triton的核心功能、跨平台安装方法、基础应用实例、高级性能优化策略、与CUDA及PyTorch的技术对比，以及在实际项目中的应用场景。技术定位与优势分析 Triton的设计阅读全文

posted @ 2025-04-16 10:01 deephub 阅读(189) 评论(0) 推荐(0)

overfit深度学习

公告