会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
9
10
11
12
13
14
15
16
17
···
139
下一页
2025年6月29日
大数据集特征工程实践:将54万样本预测误差降低68%的技术路径与代码实现详解
摘要: 特征工程作为机器学习流程中的关键环节,在模型训练之前执行,其质量直接影响模型性能。虽然深度学习模型在图像和文本等非结构化数据的特征自动学习方面表现优异,但对于表格数据集而言,显式特征工程仍然是不可替代的核心技术。本文通过实际案例演示特征工程在回归任务中的应用效果,重点分析包含数值型、分类型和时间序列
阅读全文
posted @ 2025-06-29 11:37 deephub
阅读(23)
评论(0)
推荐(0)
2025年6月28日
Arctic长序列训练技术:百万级Token序列的可扩展高效训练方法
摘要: 在现实应用场景中,许多AI系统需要处理超过数十万token的长文本序列,例如密集文档分析、长对话理解以及检索增强生成(RAG)管道等。当前大多数语言模型仅在相对较短的文本片段上进行训练。这种训练与应用需求的不匹配,类似于要求模型仅通过阅读小说的一页内容就能完成整本书的总结任务。虽然模型可能捕获到文本
阅读全文
posted @ 2025-06-28 11:27 deephub
阅读(24)
评论(0)
推荐(0)
2025年6月27日
小模型当老师效果更好:借助RLTs方法7B参数击败671B,训练成本暴降99%
摘要: Sakana AI提出的强化学习教师模型(Reinforcement-Learned Teachers, RLTs)代表了一种全新的训练范式。该方法颠覆了传统强化学习需要模型从零开始通过稀疏奖励信号解决问题的训练方式,转而从已知答案出发,训练小型"教师"模型以适合学生模型学习的方式解释解决方案。 实
阅读全文
posted @ 2025-06-27 10:42 deephub
阅读(26)
评论(0)
推荐(0)
2025年6月26日
基于Dyna-Q强化学习的智能营销系统:融合贝叶斯生存模型与Transformer注意力机制的电商客户重参与策略优化
摘要: 本文提出了一个集成三种核心技术的下一代智能优惠券分发系统:基于贝叶斯生存模型的重购概率预测、采用注意力机制的Transformer利润预测模型,以及用于策略持续优化的Dyna-Q强化学习代理。该系统构建了一个自优化的闭环架构,通过贝叶斯生存分析筛选高价值客户,利用Transformer模型预测优惠券
阅读全文
posted @ 2025-06-26 10:17 deephub
阅读(20)
评论(0)
推荐(0)
2025年6月25日
解决语义搜索痛点,基于对比学习的领域特定文本嵌入模型微调实践
摘要: 文本嵌入模型能够将文本转换为具有语义意义的向量表示,广泛应用于检索、分类等多种任务场景。然而,通用嵌入模型在处理特定领域任务时往往存在性能瓶颈。微调技术为解决这一问题提供了有效途径。本文将深入探讨嵌入模型微调的核心原理,并以AI职位匹配为例,详细阐述基于对比学习的微调实现过程。 https://av
阅读全文
posted @ 2025-06-25 10:52 deephub
阅读(7)
评论(0)
推荐(0)
2025年6月24日
基于LSTM自编码器与KMeans聚类的时间序列无监督异常检测方法
摘要: 时间序列异常检测是金融监控、网络安全防护、工业制造控制以及物联网系统监测等领域的核心技术问题。本文研究了一种结合深度学习LSTM自编码器与KMeans聚类算法的无监督异常检测方法,该方法首先利用LSTM自编码器学习序列数据的潜在表示,然后在潜在空间中应用KMeans聚类实现异常模式的自动识别。 本文
阅读全文
posted @ 2025-06-24 11:03 deephub
阅读(27)
评论(0)
推荐(0)
2025年6月23日
混合效应模型原理与实现:从理论到代码的完整解析
摘要: 考虑这样一个实际场景:在构建用于预测200家医院患者住院时长的模型时,尽管梯度提升模型在测试集上表现优异,但深入分析会发现一个系统性问题:医院A的住院时长始终高于模型预测值,而医院B则总是低于预测值。传统模型对所有医院采用相同的预测策略,忽略了各医院间的系统性差异,从而错失了提升预测准确性和获得更深
阅读全文
posted @ 2025-06-23 10:40 deephub
阅读(77)
评论(0)
推荐(0)
2025年6月22日
Chonkie:面向大语言模型的轻量级文本分块处理库
摘要: Chonkie是一个专为大语言模型(LLM)应用场景设计的轻量级文本分块处理库,提供高效的文本分割和管理解决方案。该库采用最小依赖设计理念,特别适用于现实世界的自然语言处理管道。本文将详细介绍Chonkie的核心功能、设计理念以及五种主要的文本分块策略。 Chonkie的核心理念是简化文档分块处理流
阅读全文
posted @ 2025-06-22 10:49 deephub
阅读(29)
评论(0)
推荐(0)
2025年6月21日
机器学习异常检测实战:用Isolation Forest快速构建无标签异常检测系统
摘要: 无监督异常检测作为机器学习领域的重要分支,专门用于在缺乏标记数据的环境中识别异常事件。本文深入探讨异常检测技术的理论基础与实践应用,通过Isolation Forest算法进行异常检测,并结合LightGBM作为主分类器,构建完整的欺诈检测系统。文章详细阐述了从无监督异常检测到人工反馈循环的完整工作
阅读全文
posted @ 2025-06-21 09:54 deephub
阅读(28)
评论(0)
推荐(0)
2025年6月20日
从零复现Google Veo 3:从数据预处理到视频生成的完整Python代码实现指南
摘要: Google Veo 3作为当前最先进的文本到视频生成系统,能够根据文本提示生成高质量、高分辨率的视频内容并同步生成音频。该系统在性能上已超越OpenAI SORA等同类模型,代表了视频生成领域的最新技术水平。 Google最近发布了Veo 3技术报告和模型规格说明,详细阐述了系统架构、训练流程等核
阅读全文
posted @ 2025-06-20 14:15 deephub
阅读(68)
评论(0)
推荐(0)
上一页
1
···
9
10
11
12
13
14
15
16
17
···
139
下一页
公告