会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
44
45
46
47
48
49
50
51
52
···
139
下一页
2024年6月25日
2024年6月上半月30篇大语言模型的论文推荐
摘要: 大语言模型(LLMs)在近年来取得了快速发展。本文总结了2024年6月上半月发布的一些最重要的LLM论文,可以让你及时了解最新进展。 LLM进展与基准测试 1、WildBench: Benchmarking LLMs with Challenging Tasks from Real Users in
阅读全文
posted @ 2024-06-25 12:18 deephub
阅读(54)
评论(0)
推荐(0)
2024年6月24日
特征工程与数据预处理全解析:基础技术和代码示例
摘要: 在机器学习和数据科学的世界里,数据的质量是建模成功与否的关键所在。这就是特征工程和数据预处理发挥作用的地方。本文总结的这些关键步骤可以显著提高模型的性能,获得更准确的预测,我们将深入研究处理异常值、缺失值、编码、特征缩放和特征提取的各种技术。 https://avoid.overfit.cn/pos
阅读全文
posted @ 2024-06-24 11:02 deephub
阅读(101)
评论(0)
推荐(0)
2024年6月23日
2024年6月计算机视觉论文推荐:扩散模型、视觉语言模型、视频生成等
摘要: 6月还有一周就要结束了,我们今天来总结2024年6月上半月发表的最重要的论文,重点介绍了计算机视觉领域的最新研究和进展。 Diffusion Models 1、Autoregressive Model Beats Diffusion: Llama for Scalable Image Generat
阅读全文
posted @ 2024-06-23 11:17 deephub
阅读(102)
评论(0)
推荐(0)
2024年6月22日
使用粒子滤波(particle filter)进行视频目标跟踪
摘要: 虽然有许多用于目标跟踪的算法,包括较新的基于深度学习的算法,但对于这项任务,粒子滤波仍然是一个有趣的算法。所以在这篇文章中,我们将介绍视频中的目标跟踪:预测下一帧中物体的位置。在粒子滤波以及许多其他经典跟踪算法的情况下,我们根据估计的动态进行预测,然后使用一些测量值更新预测。 我们从数学理论开始。粒
阅读全文
posted @ 2024-06-22 11:03 deephub
阅读(46)
评论(0)
推荐(0)
2024年6月21日
HUSKY:一个优化大语言模型多步推理的新代理框架
摘要: 推理被高度认可为生成人工智能的下一个前沿领域。通过推理,我们可以将任务分解为更小的子集并单独解决这些子集。例如以前的论文:思维链、思维树、思维骨架和反射,都是最近解决LLM推理能力的一些技术。此外推理还涉及一些外围功能,例如访问外部数据或工具。在最近的几年里,我们已经看到模型在特定的推理技术中表现得
阅读全文
posted @ 2024-06-21 11:01 deephub
阅读(48)
评论(0)
推荐(0)
2024年6月20日
使用深度强化学习预测股票:DQN 、Double DQN和Dueling Double DQN对比和代码示例
摘要: 深度强化学习可以将深度学习与强化学习相结合:深度学习擅长从原始数据中学习复杂的表示,强化学习则使代理能够通过反复试验在给定环境中学习最佳动作。通过DRL,研究人员和投资者可以开发能够分析历史数据的模型,理解复杂的市场动态,并对股票购买、销售或持有做出明智的决策。 下面我们一边写代码一边介绍这些相关的
阅读全文
posted @ 2024-06-20 11:28 deephub
阅读(103)
评论(0)
推荐(0)
2024年6月19日
goldfish loss:减少训练数据泄漏,提高大语言模型输出的多样性
摘要: LLMs(大型语言模型)能够记忆并重复它们的训练数据,这可能会带来隐私和版权风险。为了减轻记忆现象,论文作者引入了一种名为"goldfish loss"的微妙修改,在训练过程中,随机抽样的一部分标记被排除在损失计算之外。这些被舍弃的标记不会被模型记忆,从而防止模型完整复制训练集中的一整个标记序列。
阅读全文
posted @ 2024-06-19 10:50 deephub
阅读(25)
评论(0)
推荐(0)
2024年6月18日
Multi-Head RAG:多头注意力的激活层作为嵌入进行文档检索
摘要: 现有的RAG解决方案可能因为最相关的文档的嵌入可能在嵌入空间中相距很远,这样会导致检索过程变得复杂并且无效。为了解决这个问题,论文引入了多头RAG (MRAG),这是一种利用Transformer的多头注意层的激活而不是解码器层作为获取多方面文档的新方案。 MRAG 不是利用最后一个前馈解码器层为最
阅读全文
posted @ 2024-06-18 10:24 deephub
阅读(49)
评论(0)
推荐(0)
2024年6月17日
MLOps模型部署的三种策略:批处理、实时、边缘计算
摘要: 机器学习运维(MLOps)是一组用于自动化和简化机器学习(ML)工作流程和部署的实践。所选择的部署策略可以显著影响系统的性能和效用。所以需要根据用例和需求,采用不同的部署策略。在这篇文章中,我们将探讨三种常见的模型部署策略:批处理、实时和边缘计算。 https://avoid.overfit.cn/
阅读全文
posted @ 2024-06-17 12:34 deephub
阅读(31)
评论(0)
推荐(0)
2024年6月16日
Pixel Transformer:用像素代替补丁可以提升图像分类精度
摘要: 在快速发展的人工智能领域,ViTs已成为各种计算机视觉任务的基础模型。ViTs通过将图像划分为小块并将这些小块作为标记来处理图像。6月刚发布一篇论文,引入了一种新颖的方法,即像素级Transformers,它通过将单个像素视为令牌来挑战这种范式。本文将讨论Pixel Transformer的复杂性,
阅读全文
posted @ 2024-06-16 09:56 deephub
阅读(75)
评论(0)
推荐(0)
上一页
1
···
44
45
46
47
48
49
50
51
52
···
139
下一页
公告