会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
4
5
6
7
8
9
10
11
12
···
139
下一页
2025年8月19日
让模型不再忽视少数类:MixUp、CutMix、Focal Loss三种技术解决数据不平衡问题
摘要: 在实际的机器学习应用中,数据集规模有限且类别分布不均衡是一个普遍存在的问题。以医学影像分析为例,正类样本通常仅占总样本的5%左右。基于此类数据训练的分类模型往往会倾向于预测多数类别,虽然能够达到95%的整体准确率,但在识别关键的少数类样本方面表现不佳。 这种现象会引发过拟合、预测偏差以及关键类别召回
阅读全文
posted @ 2025-08-19 19:13 deephub
阅读(18)
评论(0)
推荐(0)
2025年8月18日
构建时序感知的智能RAG系统:让AI自动处理动态数据并实时更新知识库
摘要: 现代RAG(Retrieval-Augmented Generation)和智能体架构在处理问答任务时,依赖于能够随时间动态更新的知识库,这类知识库通常包含财务报告、技术文档等持续变化的信息。为确保推理和规划过程的逻辑性与准确性,需要建立相应的时序管理机制。 针对规模不断增长且存在幻觉风险的动态知识
阅读全文
posted @ 2025-08-18 22:13 deephub
阅读(22)
评论(0)
推荐(0)
2025年8月17日
MXFP4量化:如何在80GB GPU上运行1200亿参数的GPT-OSS模型
摘要: 大型语言模型(Large Language Models, LLMs)如GPT-OSS、GPT-4、LLaMA和Mixtral的快速发展显著提升了人工智能的能力边界,但同时也带来了严峻的内存资源挑战。以1200亿参数的模型为例,在FP16精度下仅权重存储就需要约240GB的内存空间,这远超单个NVI
阅读全文
posted @ 2025-08-17 21:31 deephub
阅读(58)
评论(0)
推荐(0)
2025年8月16日
AMD Ryzen AI Max+ 395四机并联:大语言模型集群推理深度测试
摘要: 本文介绍使用四块Framework主板构建AI推理集群的完整过程,并对其在大语言模型推理任务中的性能表现进行了系统性评估。该集群基于AMD Ryzen AI Max+ 395处理器,采用mini ITX规格设计,可部署在10英寸标准机架中。 Jeff Geerling大佬还开发了名为Beowulf
阅读全文
posted @ 2025-08-16 20:34 deephub
阅读(47)
评论(0)
推荐(0)
2025年8月15日
ReasonRank:从关键词匹配到逻辑推理,排序准确性大幅超越传统方法
摘要: 本文深入分析ReasonRank,一个采用自动化数据合成框架和两阶段训练策略(监督微调+强化学习)的先进段落重排器,该系统在信息检索领域实现了突破性的推理能力,在BRIGHT等权威基准测试中超越了参数规模更大的现有模型。 信息检索技术在过去十年中经历了深刻变革。现代搜索引擎和人工智能助手已能够精准理
阅读全文
posted @ 2025-08-15 20:18 deephub
阅读(18)
评论(0)
推荐(0)
2025年8月14日
MARS算法理论和Python代码实现:用分段回归解决非线性时间序列预测问题
摘要: 多元自适应回归样条(Multivariate Adaptive Regression Splines, MARS)是Jerome Friedman于1991年提出的一种非参数回归技术。该方法专门用于建模预测变量集合与目标变量之间的复杂非线性关系,无需预先确定具体的函数形式。本文将深入探讨MARS算法
阅读全文
posted @ 2025-08-14 20:35 deephub
阅读(15)
评论(0)
推荐(0)
2025年8月13日
Dots.ocr:告别复杂多模块架构,1.7B参数单一模型统一处理所有OCR任务
摘要: 在传统OCR技术日趋成熟的今天,一个仅有1.7B参数的视觉语言模型正在重新定义文档处理的技术边界。Dots.ocr的出现标志着OCR领域从传统多模块流水线向统一视觉语言建模的重要转变,其在多项基准测试中超越大参数模型的表现,预示着"小而精"可能比"大而全"更具实用价值。 这一技术突破的核心在于架构创
阅读全文
posted @ 2025-08-13 21:14 deephub
阅读(69)
评论(0)
推荐(0)
2025年8月12日
JAX快速上手:从NumPy到GPU加速的Python高性能计算库入门教程
摘要: NumPy作为Python数值计算领域的基础框架,凭借其强大的N维数组结构和丰富的函数生态系统,成为科学家、工程师和数据分析师的核心工具。然而,随着计算需求的快速增长,特别是在机器学习和大规模科学模拟领域,NumPy基于CPU的执行模式以及缺乏内置自动微分功能的限制愈发明显。 JAX正是为了解决这些
阅读全文
posted @ 2025-08-12 20:47 deephub
阅读(20)
评论(0)
推荐(0)
2025年8月11日
提升LangChain开发效率:10个被忽视的高效组件,让AI应用性能翻倍
摘要: 在当前的AI应用开发生态中,LangChain已成为构建大型语言模型应用的主流框架。但是大多数开发者在实际项目中仅使用其基础功能,如简单的链式调用和提示工程,而对其高级组件的潜力挖掘不足。这种使用模式导致了显著的性能损失和功能局限性。 本文将系统分析LangChain框架中十个具有重要价值但使用率相
阅读全文
posted @ 2025-08-11 21:22 deephub
阅读(9)
评论(0)
推荐(0)
2025年8月10日
大型动作模型LAM:让企业重复任务实现80%效率提升的AI技术架构与实现方案
摘要: 现代企业运营中,重复性任务的自动化处理已成为提升组织效率的核心需求。从基础数据录入到复杂工作流管理,企业持续寻求技术创新来降低人工成本、减少操作错误,并将人力资源重新配置到更具价值的战略性工作中。大型动作模型(Large Action Models, LAMs)作为人工智能领域的新兴技术架构,通过融
阅读全文
posted @ 2025-08-10 20:24 deephub
阅读(9)
评论(0)
推荐(0)
上一页
1
···
4
5
6
7
8
9
10
11
12
···
139
下一页
公告