会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
43
44
45
46
47
48
49
50
51
···
139
下一页
2024年7月5日
RouteLLM:高效LLM路由框架,可以动态选择优化成本与响应质量的平衡
摘要: 该论文提出了一个新的框架,用于在强模型和弱模型之间进行查询路由选择。通过学习用户偏好数据,预测强模型获胜的概率,并根据成本阈值来决定使用哪种模型处理查询 。该研究主要应用于大规模语言模型(LLMs)的实际部署中,通过智能路由在保证响应质量的前提下显著降低成本。 通过创新的路由框架和算法,有效地在强模
阅读全文
posted @ 2024-07-05 10:54 deephub
阅读(219)
评论(0)
推荐(0)
2024年7月4日
字符串相似度算法完全指南:编辑、令牌与序列三类算法的全面解析与深入分析
摘要: 在自然语言处理领域,人们经常需要比较字符串,这些字符串可能是单词、句子、段落甚至是整个文档。如何快速判断两个单词或句子是否相似,或者相似度是好还是差。这类似于我们使用手机打错一个词,但手机会建议正确的词来修正它,那么这种如何判断字符串相似度呢?本文将详细介绍这个问题。 字符串相似度 当我们有两个数字
阅读全文
posted @ 2024-07-04 11:25 deephub
阅读(96)
评论(0)
推荐(0)
2024年7月3日
使用 PyTorch 创建的多步时间序列预测的 Encoder-Decoder 模型
摘要: Encoder-decoder 模型在序列到序列的自然语言处理任务(如语言翻译等)中提供了最先进的结果。多步时间序列预测也可以被视为一个 seq2seq 任务,可以使用 encoder-decoder 模型来处理。本文提供了一个用于解决 Kaggle 时间序列预测任务的 encoder-decode
阅读全文
posted @ 2024-07-03 14:44 deephub
阅读(82)
评论(0)
推荐(0)
2024年7月2日
图神经网络版本的Kolmogorov Arnold(KAN)代码实现和效果对比
摘要: Kolmogorov Arnold Networks (KAN)最近作为MLP的替代而流行起来,KANs使用Kolmogorov-Arnold表示定理的属性,该定理允许神经网络的激活函数在边缘上执行,这使得激活函数“可学习”并改进它们。 目前我们看到有很多使用KAN替代MLP的实验,但是目前来说对于
阅读全文
posted @ 2024-07-02 11:38 deephub
阅读(218)
评论(0)
推荐(0)
2024年7月1日
DeepMind的新论文,长上下文的大语言模型能否取代RAG或者SQL这样的传统技术呢?
摘要: 长上下文大型语言模型(LCLLMs)确实引起了一些关注。这类模型可能使某些任务的解决更加高效。例如理论上可以用来对整本书进行总结。有人认为,LCLLMs不需要像RAG这样的外部工具,这有助于优化并避免级联错误。但是也有许多人对此持怀疑态度,并且后来的研究表明,这些模型并没有真正利用长上下文。还有人声
阅读全文
posted @ 2024-07-01 10:48 deephub
阅读(29)
评论(0)
推荐(0)
2024年6月30日
深入解析高斯过程:数学理论、重要概念和直观可视化全解
摘要: 与其他算法相比,高斯过程不那么流行,但是如果你只有少量的数据,那么可以首先高斯过程。在这篇文章中,我将详细介绍高斯过程。并可视化和Python实现来解释高斯过程的数学理论。 多元高斯分布 多元高斯分布是理解高斯过程所必须的概念之一。让我们快速回顾一下。如果你已经熟悉多元高斯分布,可以跳过这一部分。
阅读全文
posted @ 2024-06-30 11:49 deephub
阅读(128)
评论(0)
推荐(0)
2024年6月29日
Transformer 能代替图神经网络吗?
摘要: 当Transformer模型发布时,它彻底革新了机器翻译领域。虽然最初是为特定任务设计的,但这种革命性的架构显示出它可以轻松适应不同的任务。随后成为了Transformer一个标准,甚至用于它最初设计之外的数据(如图像和其他序列数据)。 然后人们也开始优化和寻找替代方案,主要是为了减少计算成本(自注
阅读全文
posted @ 2024-06-29 10:44 deephub
阅读(54)
评论(0)
推荐(0)
2024年6月28日
RAG流程优化(微调)的4个基本策略
摘要: 在本文中,我们将介绍使用私有数据优化检索增强生成(RAG)的四种策略,可以提升生成任务的质量和准确性。通过使用一些优化策略,可以有效提升检索增强生成系统的性能和输出质量,使其在实际应用中能够更好地满足需求。 RAG简单回顾 RAG主要有两个过程。第一个是“数据收集过程”,它收集来自不同来源的数据,将
阅读全文
posted @ 2024-06-28 11:43 deephub
阅读(203)
评论(0)
推荐(0)
2024年6月27日
Theta方法:一种时间序列分解与预测的简化方法
摘要: Theta方法整合了两个基本概念:分解时间序列和利用基本预测技术来估计未来的价值。 每个数据科学爱好者都知道,时间序列是按一定时间间隔收集或记录的一系列数据点。例如,每日温度或经济指标的月值。把时间序列想象成不同成分的组合,趋势(数据移动的一般方向),季节性(随时间重复的规律模式)和噪声(不能归因于
阅读全文
posted @ 2024-06-27 10:24 deephub
阅读(125)
评论(0)
推荐(0)
2024年6月26日
精选:15款顶尖Python知识图谱(关系网络)绘制工具,数据分析的强力助手
摘要: 知识图谱(关系网络)可以用简单的形状和线条显示复杂的系统,帮助我们理解数据之间的联系。我们今天将介绍15个很好用的免费工具,可以帮助我们绘制网络图。 NetworkX NetworkX是一个用于处理网络的Python工具。许多人在Python中处理图数据时使用NetworkX。它也是许多图AI工具的
阅读全文
posted @ 2024-06-26 11:41 deephub
阅读(170)
评论(0)
推荐(0)
上一页
1
···
43
44
45
46
47
48
49
50
51
···
139
下一页
公告