会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
9
10
11
12
13
14
15
16
17
···
144
下一页
2025年8月16日
AMD Ryzen AI Max+ 395四机并联:大语言模型集群推理深度测试
摘要: 本文介绍使用四块Framework主板构建AI推理集群的完整过程,并对其在大语言模型推理任务中的性能表现进行了系统性评估。该集群基于AMD Ryzen AI Max+ 395处理器,采用mini ITX规格设计,可部署在10英寸标准机架中。 Jeff Geerling大佬还开发了名为Beowulf
阅读全文
posted @ 2025-08-16 20:34 deephub
阅读(73)
评论(0)
推荐(0)
2025年8月15日
ReasonRank:从关键词匹配到逻辑推理,排序准确性大幅超越传统方法
摘要: 本文深入分析ReasonRank,一个采用自动化数据合成框架和两阶段训练策略(监督微调+强化学习)的先进段落重排器,该系统在信息检索领域实现了突破性的推理能力,在BRIGHT等权威基准测试中超越了参数规模更大的现有模型。 信息检索技术在过去十年中经历了深刻变革。现代搜索引擎和人工智能助手已能够精准理
阅读全文
posted @ 2025-08-15 20:18 deephub
阅读(21)
评论(0)
推荐(0)
2025年8月14日
MARS算法理论和Python代码实现:用分段回归解决非线性时间序列预测问题
摘要: 多元自适应回归样条(Multivariate Adaptive Regression Splines, MARS)是Jerome Friedman于1991年提出的一种非参数回归技术。该方法专门用于建模预测变量集合与目标变量之间的复杂非线性关系,无需预先确定具体的函数形式。本文将深入探讨MARS算法
阅读全文
posted @ 2025-08-14 20:35 deephub
阅读(17)
评论(0)
推荐(0)
2025年8月13日
Dots.ocr:告别复杂多模块架构,1.7B参数单一模型统一处理所有OCR任务
摘要: 在传统OCR技术日趋成熟的今天,一个仅有1.7B参数的视觉语言模型正在重新定义文档处理的技术边界。Dots.ocr的出现标志着OCR领域从传统多模块流水线向统一视觉语言建模的重要转变,其在多项基准测试中超越大参数模型的表现,预示着"小而精"可能比"大而全"更具实用价值。 这一技术突破的核心在于架构创
阅读全文
posted @ 2025-08-13 21:14 deephub
阅读(77)
评论(0)
推荐(0)
2025年8月12日
JAX快速上手:从NumPy到GPU加速的Python高性能计算库入门教程
摘要: NumPy作为Python数值计算领域的基础框架,凭借其强大的N维数组结构和丰富的函数生态系统,成为科学家、工程师和数据分析师的核心工具。然而,随着计算需求的快速增长,特别是在机器学习和大规模科学模拟领域,NumPy基于CPU的执行模式以及缺乏内置自动微分功能的限制愈发明显。 JAX正是为了解决这些
阅读全文
posted @ 2025-08-12 20:47 deephub
阅读(26)
评论(0)
推荐(0)
2025年8月11日
提升LangChain开发效率:10个被忽视的高效组件,让AI应用性能翻倍
摘要: 在当前的AI应用开发生态中,LangChain已成为构建大型语言模型应用的主流框架。但是大多数开发者在实际项目中仅使用其基础功能,如简单的链式调用和提示工程,而对其高级组件的潜力挖掘不足。这种使用模式导致了显著的性能损失和功能局限性。 本文将系统分析LangChain框架中十个具有重要价值但使用率相
阅读全文
posted @ 2025-08-11 21:22 deephub
阅读(12)
评论(0)
推荐(0)
2025年8月10日
大型动作模型LAM:让企业重复任务实现80%效率提升的AI技术架构与实现方案
摘要: 现代企业运营中,重复性任务的自动化处理已成为提升组织效率的核心需求。从基础数据录入到复杂工作流管理,企业持续寻求技术创新来降低人工成本、减少操作错误,并将人力资源重新配置到更具价值的战略性工作中。大型动作模型(Large Action Models, LAMs)作为人工智能领域的新兴技术架构,通过融
阅读全文
posted @ 2025-08-10 20:24 deephub
阅读(11)
评论(0)
推荐(0)
2025年8月9日
使用LangGraph从零构建多智能体AI系统:实现智能协作的完整指南
摘要: 想象一下:只需四小时,一位初级开发者就能构建出同时处理事实核查、摘要生成、情感分析和多数据源交叉引用的AI研究助手。这在六个月前需要高级工程师团队数周的开发时间,如今借助LangGraph多智能体框架已经成为现实。 传统AI应用依赖单一大型模型处理所有任务,就像让一个人同时担任研究员、作家、事实核查
阅读全文
posted @ 2025-08-09 18:47 deephub
阅读(56)
评论(0)
推荐(0)
2025年8月8日
PCA多变量离群点检测:Hotelling's T2与SPE方法原理及应用指南
摘要: 主成分分析(Principal Component Analysis, PCA)作为一种经典的无监督降维技术,在保留数据主要信息的同时能够有效压缩数据维度。由于PCA对数据变异性的高度敏感性,该方法在多变量异常值检测领域展现出独特的优势。 当分析任务需要建立早期预警系统以识别异常状态,并且要求结果具
阅读全文
posted @ 2025-08-08 20:21 deephub
阅读(21)
评论(0)
推荐(0)
2025年8月7日
论文解读:单个标点符号如何欺骗LLM,攻破AI评判系统
摘要: 可验证奖励强化学习(Reinforcement Learning with Verifiable Rewards, RLVR)是一种基于参考标准的训练范式,其核心在于通过基于规则的函数或生成式LLM评判器来提供奖励信号。在RLVR训练过程中,奖励模型接收问题q、策略模型生成的响应r以及参考答案a∗作
阅读全文
posted @ 2025-08-07 20:47 deephub
阅读(17)
评论(0)
推荐(0)
上一页
1
···
9
10
11
12
13
14
15
16
17
···
144
下一页
公告