会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
14
15
16
17
18
19
20
21
22
···
144
下一页
2025年6月27日
小模型当老师效果更好:借助RLTs方法7B参数击败671B,训练成本暴降99%
摘要: Sakana AI提出的强化学习教师模型(Reinforcement-Learned Teachers, RLTs)代表了一种全新的训练范式。该方法颠覆了传统强化学习需要模型从零开始通过稀疏奖励信号解决问题的训练方式,转而从已知答案出发,训练小型"教师"模型以适合学生模型学习的方式解释解决方案。 实
阅读全文
posted @ 2025-06-27 10:42 deephub
阅读(30)
评论(0)
推荐(0)
2025年6月26日
基于Dyna-Q强化学习的智能营销系统:融合贝叶斯生存模型与Transformer注意力机制的电商客户重参与策略优化
摘要: 本文提出了一个集成三种核心技术的下一代智能优惠券分发系统:基于贝叶斯生存模型的重购概率预测、采用注意力机制的Transformer利润预测模型,以及用于策略持续优化的Dyna-Q强化学习代理。该系统构建了一个自优化的闭环架构,通过贝叶斯生存分析筛选高价值客户,利用Transformer模型预测优惠券
阅读全文
posted @ 2025-06-26 10:17 deephub
阅读(23)
评论(0)
推荐(0)
2025年6月25日
解决语义搜索痛点,基于对比学习的领域特定文本嵌入模型微调实践
摘要: 文本嵌入模型能够将文本转换为具有语义意义的向量表示,广泛应用于检索、分类等多种任务场景。然而,通用嵌入模型在处理特定领域任务时往往存在性能瓶颈。微调技术为解决这一问题提供了有效途径。本文将深入探讨嵌入模型微调的核心原理,并以AI职位匹配为例,详细阐述基于对比学习的微调实现过程。 https://av
阅读全文
posted @ 2025-06-25 10:52 deephub
阅读(12)
评论(0)
推荐(0)
2025年6月24日
基于LSTM自编码器与KMeans聚类的时间序列无监督异常检测方法
摘要: 时间序列异常检测是金融监控、网络安全防护、工业制造控制以及物联网系统监测等领域的核心技术问题。本文研究了一种结合深度学习LSTM自编码器与KMeans聚类算法的无监督异常检测方法,该方法首先利用LSTM自编码器学习序列数据的潜在表示,然后在潜在空间中应用KMeans聚类实现异常模式的自动识别。 本文
阅读全文
posted @ 2025-06-24 11:03 deephub
阅读(37)
评论(0)
推荐(0)
2025年6月23日
混合效应模型原理与实现:从理论到代码的完整解析
摘要: 考虑这样一个实际场景:在构建用于预测200家医院患者住院时长的模型时,尽管梯度提升模型在测试集上表现优异,但深入分析会发现一个系统性问题:医院A的住院时长始终高于模型预测值,而医院B则总是低于预测值。传统模型对所有医院采用相同的预测策略,忽略了各医院间的系统性差异,从而错失了提升预测准确性和获得更深
阅读全文
posted @ 2025-06-23 10:40 deephub
阅读(94)
评论(0)
推荐(0)
2025年6月22日
Chonkie:面向大语言模型的轻量级文本分块处理库
摘要: Chonkie是一个专为大语言模型(LLM)应用场景设计的轻量级文本分块处理库,提供高效的文本分割和管理解决方案。该库采用最小依赖设计理念,特别适用于现实世界的自然语言处理管道。本文将详细介绍Chonkie的核心功能、设计理念以及五种主要的文本分块策略。 Chonkie的核心理念是简化文档分块处理流
阅读全文
posted @ 2025-06-22 10:49 deephub
阅读(37)
评论(0)
推荐(0)
2025年6月21日
机器学习异常检测实战:用Isolation Forest快速构建无标签异常检测系统
摘要: 无监督异常检测作为机器学习领域的重要分支,专门用于在缺乏标记数据的环境中识别异常事件。本文深入探讨异常检测技术的理论基础与实践应用,通过Isolation Forest算法进行异常检测,并结合LightGBM作为主分类器,构建完整的欺诈检测系统。文章详细阐述了从无监督异常检测到人工反馈循环的完整工作
阅读全文
posted @ 2025-06-21 09:54 deephub
阅读(33)
评论(0)
推荐(0)
2025年6月20日
从零复现Google Veo 3:从数据预处理到视频生成的完整Python代码实现指南
摘要: Google Veo 3作为当前最先进的文本到视频生成系统,能够根据文本提示生成高质量、高分辨率的视频内容并同步生成音频。该系统在性能上已超越OpenAI SORA等同类模型,代表了视频生成领域的最新技术水平。 Google最近发布了Veo 3技术报告和模型规格说明,详细阐述了系统架构、训练流程等核
阅读全文
posted @ 2025-06-20 14:15 deephub
阅读(89)
评论(0)
推荐(0)
2025年6月19日
Python构建MCP服务器完整教程:5步打造专属AI工具调用系统
摘要: 模型控制协议(Model Control Protocol, MCP)是一种专为实现AI代理与工具解耦而设计的通信协议,为AI驱动应用程序的开发提供了高度的灵活性和模块化架构。通过MCP服务器,AI代理能够动态发现并调用各种工具来响应用户请求。本文将详细介绍MCP服务器的构建过程,包括工具函数的注册
阅读全文
posted @ 2025-06-19 10:30 deephub
阅读(251)
评论(0)
推荐(0)
2025年6月18日
Adaptive-k 检索:RAG 系统中自适应上下文长度选择的新方法
摘要: 本文介绍 Adaptive-k 检索技术,这是一种通过相似性分布分析动态确定最优上下文规模的即插即用方法,该技术在显著降低 token 消耗的同时实现了检索增强生成系统的性能提升。 在检索增强生成(RAG)技术快速发展的当前阶段,一个核心问题始终困扰着研究人员和工程师:如何确定最优的上下文长度? 上
阅读全文
posted @ 2025-06-18 10:43 deephub
阅读(23)
评论(0)
推荐(0)
上一页
1
···
14
15
16
17
18
19
20
21
22
···
144
下一页
公告