上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 139 下一页
摘要: 特征工程作为机器学习流程中的关键环节,在模型训练之前执行,其质量直接影响模型性能。虽然深度学习模型在图像和文本等非结构化数据的特征自动学习方面表现优异,但对于表格数据集而言,显式特征工程仍然是不可替代的核心技术。本文通过实际案例演示特征工程在回归任务中的应用效果,重点分析包含数值型、分类型和时间序列 阅读全文
posted @ 2025-06-29 11:37 deephub 阅读(23) 评论(0) 推荐(0)
摘要: 在现实应用场景中,许多AI系统需要处理超过数十万token的长文本序列,例如密集文档分析、长对话理解以及检索增强生成(RAG)管道等。当前大多数语言模型仅在相对较短的文本片段上进行训练。这种训练与应用需求的不匹配,类似于要求模型仅通过阅读小说的一页内容就能完成整本书的总结任务。虽然模型可能捕获到文本 阅读全文
posted @ 2025-06-28 11:27 deephub 阅读(24) 评论(0) 推荐(0)
摘要: Sakana AI提出的强化学习教师模型(Reinforcement-Learned Teachers, RLTs)代表了一种全新的训练范式。该方法颠覆了传统强化学习需要模型从零开始通过稀疏奖励信号解决问题的训练方式,转而从已知答案出发,训练小型"教师"模型以适合学生模型学习的方式解释解决方案。 实 阅读全文
posted @ 2025-06-27 10:42 deephub 阅读(26) 评论(0) 推荐(0)
摘要: 本文提出了一个集成三种核心技术的下一代智能优惠券分发系统:基于贝叶斯生存模型的重购概率预测、采用注意力机制的Transformer利润预测模型,以及用于策略持续优化的Dyna-Q强化学习代理。该系统构建了一个自优化的闭环架构,通过贝叶斯生存分析筛选高价值客户,利用Transformer模型预测优惠券 阅读全文
posted @ 2025-06-26 10:17 deephub 阅读(20) 评论(0) 推荐(0)
摘要: 文本嵌入模型能够将文本转换为具有语义意义的向量表示,广泛应用于检索、分类等多种任务场景。然而,通用嵌入模型在处理特定领域任务时往往存在性能瓶颈。微调技术为解决这一问题提供了有效途径。本文将深入探讨嵌入模型微调的核心原理,并以AI职位匹配为例,详细阐述基于对比学习的微调实现过程。 https://av 阅读全文
posted @ 2025-06-25 10:52 deephub 阅读(7) 评论(0) 推荐(0)
摘要: 时间序列异常检测是金融监控、网络安全防护、工业制造控制以及物联网系统监测等领域的核心技术问题。本文研究了一种结合深度学习LSTM自编码器与KMeans聚类算法的无监督异常检测方法,该方法首先利用LSTM自编码器学习序列数据的潜在表示,然后在潜在空间中应用KMeans聚类实现异常模式的自动识别。 本文 阅读全文
posted @ 2025-06-24 11:03 deephub 阅读(27) 评论(0) 推荐(0)
摘要: 考虑这样一个实际场景:在构建用于预测200家医院患者住院时长的模型时,尽管梯度提升模型在测试集上表现优异,但深入分析会发现一个系统性问题:医院A的住院时长始终高于模型预测值,而医院B则总是低于预测值。传统模型对所有医院采用相同的预测策略,忽略了各医院间的系统性差异,从而错失了提升预测准确性和获得更深 阅读全文
posted @ 2025-06-23 10:40 deephub 阅读(77) 评论(0) 推荐(0)
摘要: Chonkie是一个专为大语言模型(LLM)应用场景设计的轻量级文本分块处理库,提供高效的文本分割和管理解决方案。该库采用最小依赖设计理念,特别适用于现实世界的自然语言处理管道。本文将详细介绍Chonkie的核心功能、设计理念以及五种主要的文本分块策略。 Chonkie的核心理念是简化文档分块处理流 阅读全文
posted @ 2025-06-22 10:49 deephub 阅读(29) 评论(0) 推荐(0)
摘要: 无监督异常检测作为机器学习领域的重要分支,专门用于在缺乏标记数据的环境中识别异常事件。本文深入探讨异常检测技术的理论基础与实践应用,通过Isolation Forest算法进行异常检测,并结合LightGBM作为主分类器,构建完整的欺诈检测系统。文章详细阐述了从无监督异常检测到人工反馈循环的完整工作 阅读全文
posted @ 2025-06-21 09:54 deephub 阅读(28) 评论(0) 推荐(0)
摘要: Google Veo 3作为当前最先进的文本到视频生成系统,能够根据文本提示生成高质量、高分辨率的视频内容并同步生成音频。该系统在性能上已超越OpenAI SORA等同类模型,代表了视频生成领域的最新技术水平。 Google最近发布了Veo 3技术报告和模型规格说明,详细阐述了系统架构、训练流程等核 阅读全文
posted @ 2025-06-20 14:15 deephub 阅读(68) 评论(0) 推荐(0)
上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 139 下一页