会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
59
60
61
62
63
64
65
66
67
···
144
下一页
2024年3月7日
LLM 加速技巧:Muti Query Attention
摘要: MQA 是 19 年提出的一种新的 Attention 机制,其能够在保证模型效果的同时加快 decoder 生成 token 的速度。在大语言模型时代被广泛使用,很多LLM都采用了MQA,如Falcon、PaLM、StarCoder等。 在介绍MQA 之前,我们先回顾一下传统的多头注意力 Mult
阅读全文
posted @ 2024-03-07 09:44 deephub
阅读(65)
评论(0)
推荐(0)
2024年3月6日
RNN又行了!DeepMind新发布的Griffin可以与同级别的LLM性能相当
摘要: Hawk和Griffin是DeepMind推出的新型循环神经网络(RNNs),2月刚刚发布在arxiv上。Hawk通过使用门控线性递归(gated linear recurrences)超越了Mamba的性能,而Griffin则是一种混合型模型,结合了门控线性递归和局部注意力(local atten
阅读全文
posted @ 2024-03-06 10:58 deephub
阅读(51)
评论(0)
推荐(0)
2024年3月5日
使用纹理对比度检测检测AI生成的图像
摘要: 在本篇文章中我们将介绍如何开发一个深度学习模型来检测人工智能生成的图像 大多数用于检测人工智能生成图像的深度学习方法取决于生成图像的方法,或者取决于图像的性质/语义,其中模型只能检测人工智能生成的人、脸、汽车等特定对象。 但是这篇论文“Rich and Poor Texture Contrast:
阅读全文
posted @ 2024-03-05 10:27 deephub
阅读(84)
评论(0)
推荐(0)
2024年3月4日
Vision Transformers的注意力层概念解释和代码实现
摘要: 2017年推出《Attention is All You Need》以来,transformers 已经成为自然语言处理(NLP)的最新技术。2021年,《An Image is Worth 16x16 Words》,成功地将transformers 用于计算机视觉任务。从那时起,许多基于trans
阅读全文
posted @ 2024-03-04 10:42 deephub
阅读(54)
评论(0)
推荐(0)
2024年3月3日
使用TensorRT-LLM进行生产环境的部署指南
摘要: TensorRT-LLM是一个由Nvidia设计的开源框架,用于在生产环境中提高大型语言模型的性能。该框架是基于 TensorRT 深度学习编译框架来构建、编译并执行计算图,并借鉴了许多 FastTransformer 中高效的 Kernels 实现,并且可以利用 NCCL 完成设备之间的通讯。 虽
阅读全文
posted @ 2024-03-03 10:08 deephub
阅读(152)
评论(0)
推荐(0)
2024年3月2日
Pytorch中张量的高级选择操作
摘要: 在某些情况下,我们需要用Pytorch做一些高级的索引/选择,所以在这篇文章中,我们将介绍这类任务的三种最常见的方法:torch.index_select, torch.gather and torch.take 我们首先从一个2D示例开始,并将选择结果可视化,然后延申到3D和更复杂场景。最后以表格
阅读全文
posted @ 2024-03-02 13:55 deephub
阅读(30)
评论(0)
推荐(0)
2024年3月1日
可视化FAISS矢量空间并调整RAG参数提高结果精度
摘要: 随着开源大型语言模型的性能不断提高,编写和分析代码、推荐、文本摘要和问答(QA)对的性能都有了很大的提高。但是当涉及到QA时,LLM通常会在未训练数据的相关的问题上有所欠缺,很多内部文件都保存在公司内部,以确保合规性、商业秘密或隐私。当查询这些文件时,会使得LLM产生幻觉,产生不相关、捏造或不一致的
阅读全文
posted @ 2024-03-01 10:25 deephub
阅读(79)
评论(0)
推荐(0)
2024年2月29日
谷歌Gemma介绍、微调、量化和推理
摘要: 谷歌的最新的Gemma模型是第一个使用与Gemini模型相同的研究和技术构建的开源LLM。这个系列的模型目前有两种尺寸,2B和7B,并且提供了聊天的基本版和指令版。 用一句话来总结Gemma就是:学习了Llama 2和Mistral 7B的优点,使用了更多的Token和单词进行了训练了一个更好的7B
阅读全文
posted @ 2024-02-29 10:54 deephub
阅读(219)
评论(0)
推荐(0)
2024年2月28日
2024年2月深度学习的论文推荐
摘要: 我们这篇文章将推荐2月份发布的10篇深度学习的论文 Beyond A*: Better Planning with Transformers via Search Dynamics Bootstrapping. https://arxiv.org/abs/2402.14083 Searchforme
阅读全文
posted @ 2024-02-28 10:48 deephub
阅读(80)
评论(0)
推荐(0)
2024年2月27日
PyTimeTK: 一个简单有效的时间序列分析库
摘要: 时间序列分析是数据科学的重要组成部分,特别是在金融、经济、天气预报等领域。它包括分析随时间收集或索引的数据点,以确定趋势、周期或季节变化。由于时间序列数据的复杂性所以分析时间序列需要复杂统计方法,我最近在Github上发现了一个刚刚发布不久的Python时间工具包PyTimeTK ,它可以帮我们简化
阅读全文
posted @ 2024-02-27 09:39 deephub
阅读(54)
评论(0)
推荐(0)
上一页
1
···
59
60
61
62
63
64
65
66
67
···
144
下一页
公告