会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
59
60
61
62
63
64
65
66
67
···
139
下一页
2024年1月12日
在Colab上测试Mamba
摘要: 我们在前面的文章介绍了研究人员推出了一种挑战Transformer的新架构Mamba 他们的研究表明,Mamba是一种状态空间模型(SSM),在不同的模式(如语言、音频和时间序列)中表现出卓越的性能。为了说明这一点,研究人员使用Mamba-3B模型进行了语言建模实验。该模型超越了基于相同大小的Tra
阅读全文
posted @ 2024-01-12 09:37 deephub
阅读(106)
评论(0)
推荐(0)
2024年1月11日
使用CLIP和LLM构建多模态RAG系统
摘要: 使用CLIP和LLM构建多模态RAG系统 在本文中我们将探讨使用开源大型语言多模态模型(Large Language Multi-Modal)构建检索增强生成(RAG)系统。本文的重点是在不依赖LangChain或LLlama index的情况下实现这一目标,这样可以避免更多的框架依赖。 什么是RA
阅读全文
posted @ 2024-01-11 10:39 deephub
阅读(265)
评论(0)
推荐(0)
2024年1月10日
使用PyTorch实现混合专家(MoE)模型
摘要: Mixtral 8x7B 的推出在开放 AI 领域引发了广泛关注,特别是混合专家(Mixture-of-Experts:MoEs)这一概念被大家所认知。混合专家(MoE)概念是协作智能的象征,体现了“整体大于部分之和”的说法。MoE模型汇集了各种专家模型的优势,以提供更好的预测。它是围绕一个门控网络
阅读全文
posted @ 2024-01-10 09:54 deephub
阅读(272)
评论(0)
推荐(0)
2024年1月9日
挑战Transformer的新架构Mamba解析以及Pytorch复现
摘要: 今天我们来详细研究这篇论文“Mamba:具有选择性状态空间的线性时间序列建模” Mamba一直在人工智能界掀起波澜,被吹捧为Transformer的潜在竞争对手。到底是什么让Mamba在拥挤的序列建中脱颖而出? 在介绍之前先简要回顾一下现有的模型 Transformer:以其注意力机制而闻名,其中序
阅读全文
posted @ 2024-01-09 09:57 deephub
阅读(745)
评论(0)
推荐(0)
2024年1月8日
使用知识图谱提高RAG的能力,减少大模型幻觉
摘要: 在使用大型语言模型(llm)时,幻觉是一个常见的问题。LLM生成流畅连贯的文本,但往往生成不准确或不一致的信息。防止LLM产生幻觉的方法之一是使用提供事实信息的外部知识来源,如数据库或知识图谱。 向量数据库和知识图谱 向量数据库 向量数据库是表示实体或概念(如单词、短语或文档)的高维向量的集合。数据
阅读全文
posted @ 2024-01-08 09:40 deephub
阅读(147)
评论(0)
推荐(0)
2024年1月7日
使用PyTorch实现去噪扩散模型
摘要: 在深入研究去噪扩散概率模型(DDPM)如何工作的细节之前,让我们先看看生成式人工智能的一些发展,也就是DDPM的一些基础研究。 VAE VAE 采用了编码器、概率潜在空间和解码器。在训练过程中,编码器预测每个图像的均值和方差。然后从高斯分布中对这些值进行采样,并将其传递到解码器中,其中输入的图像预计
阅读全文
posted @ 2024-01-07 10:47 deephub
阅读(94)
评论(0)
推荐(0)
2024年1月6日
Python 中的==操作符 和 is关键字
摘要: Python是一种功能强大的通用编程语言,提供了各种比较值和对象的方法。其中包括==操作符和is关键字,它们的用途不同,但由于它们有时可以达到相同的目的,所以经常会被混淆。在本文中,我们将深入研究==和is之间的区别,探索它们如何工作以及何时适当地使用它们。 https://avoid.overfi
阅读全文
posted @ 2024-01-06 09:41 deephub
阅读(16)
评论(0)
推荐(0)
2024年1月5日
4种SVM主要核函数及相关参数的比较
摘要: 本文将用数据可视化的方法解释4种支持向量机核函数和参数的区别 简单地说,支持向量机(SVM)是一种用于分类的监督机器学习技术。它的工作原理是计算一个最好地分隔类的最大边距的超平面。 支持向量机除了提供简单的线性分离之外,还可以通过应用不同的核方法进行非线性分类。参数设置也是SVM更好地工作的另一个重
阅读全文
posted @ 2024-01-05 09:58 deephub
阅读(84)
评论(0)
推荐(0)
2024年1月4日
使用pytorch构建图卷积网络预测化学分子性质
摘要: 在本文中,我们将通过化学的视角探索图卷积网络,我们将尝试将网络的特征与自然科学中的传统模型进行比较,并思考为什么它的工作效果要比传统的方法好。 https://avoid.overfit.cn/post/7cfa0930651b4b4cac912952d8c53d54
阅读全文
posted @ 2024-01-04 10:03 deephub
阅读(69)
评论(0)
推荐(0)
2024年1月3日
如何避免LLM的“幻觉”(Hallucination)
摘要: 生成式大语言模型(LLM)可以针对各种用户的 prompt 生成高度流畅的回复。然而,大模型倾向于产生幻觉或做出非事实陈述,这可能会损害用户的信任。 大语言模型的长而详细的输出看起来很有说服力,但是这些输出很有可能是虚构的。这是否意味着我们不能信任聊天机器人,每次都必须手动检查输出的事实?有一些方法
阅读全文
posted @ 2024-01-03 09:41 deephub
阅读(113)
评论(0)
推荐(0)
上一页
1
···
59
60
61
62
63
64
65
66
67
···
139
下一页
公告