会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
67
68
69
70
71
72
73
74
75
···
147
下一页
2024年1月10日
使用PyTorch实现混合专家(MoE)模型
摘要: Mixtral 8x7B 的推出在开放 AI 领域引发了广泛关注,特别是混合专家(Mixture-of-Experts:MoEs)这一概念被大家所认知。混合专家(MoE)概念是协作智能的象征,体现了“整体大于部分之和”的说法。MoE模型汇集了各种专家模型的优势,以提供更好的预测。它是围绕一个门控网络
阅读全文
posted @ 2024-01-10 09:54 deephub
阅读(286)
评论(0)
推荐(0)
2024年1月9日
挑战Transformer的新架构Mamba解析以及Pytorch复现
摘要: 今天我们来详细研究这篇论文“Mamba:具有选择性状态空间的线性时间序列建模” Mamba一直在人工智能界掀起波澜,被吹捧为Transformer的潜在竞争对手。到底是什么让Mamba在拥挤的序列建中脱颖而出? 在介绍之前先简要回顾一下现有的模型 Transformer:以其注意力机制而闻名,其中序
阅读全文
posted @ 2024-01-09 09:57 deephub
阅读(772)
评论(0)
推荐(0)
2024年1月8日
使用知识图谱提高RAG的能力,减少大模型幻觉
摘要: 在使用大型语言模型(llm)时,幻觉是一个常见的问题。LLM生成流畅连贯的文本,但往往生成不准确或不一致的信息。防止LLM产生幻觉的方法之一是使用提供事实信息的外部知识来源,如数据库或知识图谱。 向量数据库和知识图谱 向量数据库 向量数据库是表示实体或概念(如单词、短语或文档)的高维向量的集合。数据
阅读全文
posted @ 2024-01-08 09:40 deephub
阅读(160)
评论(0)
推荐(0)
2024年1月7日
使用PyTorch实现去噪扩散模型
摘要: 在深入研究去噪扩散概率模型(DDPM)如何工作的细节之前,让我们先看看生成式人工智能的一些发展,也就是DDPM的一些基础研究。 VAE VAE 采用了编码器、概率潜在空间和解码器。在训练过程中,编码器预测每个图像的均值和方差。然后从高斯分布中对这些值进行采样,并将其传递到解码器中,其中输入的图像预计
阅读全文
posted @ 2024-01-07 10:47 deephub
阅读(105)
评论(0)
推荐(0)
2024年1月6日
Python 中的==操作符 和 is关键字
摘要: Python是一种功能强大的通用编程语言,提供了各种比较值和对象的方法。其中包括==操作符和is关键字,它们的用途不同,但由于它们有时可以达到相同的目的,所以经常会被混淆。在本文中,我们将深入研究==和is之间的区别,探索它们如何工作以及何时适当地使用它们。 https://avoid.overfi
阅读全文
posted @ 2024-01-06 09:41 deephub
阅读(27)
评论(0)
推荐(0)
2024年1月5日
4种SVM主要核函数及相关参数的比较
摘要: 本文将用数据可视化的方法解释4种支持向量机核函数和参数的区别 简单地说,支持向量机(SVM)是一种用于分类的监督机器学习技术。它的工作原理是计算一个最好地分隔类的最大边距的超平面。 支持向量机除了提供简单的线性分离之外,还可以通过应用不同的核方法进行非线性分类。参数设置也是SVM更好地工作的另一个重
阅读全文
posted @ 2024-01-05 09:58 deephub
阅读(92)
评论(0)
推荐(0)
2024年1月4日
使用pytorch构建图卷积网络预测化学分子性质
摘要: 在本文中,我们将通过化学的视角探索图卷积网络,我们将尝试将网络的特征与自然科学中的传统模型进行比较,并思考为什么它的工作效果要比传统的方法好。 https://avoid.overfit.cn/post/7cfa0930651b4b4cac912952d8c53d54
阅读全文
posted @ 2024-01-04 10:03 deephub
阅读(74)
评论(0)
推荐(0)
2024年1月3日
如何避免LLM的“幻觉”(Hallucination)
摘要: 生成式大语言模型(LLM)可以针对各种用户的 prompt 生成高度流畅的回复。然而,大模型倾向于产生幻觉或做出非事实陈述,这可能会损害用户的信任。 大语言模型的长而详细的输出看起来很有说服力,但是这些输出很有可能是虚构的。这是否意味着我们不能信任聊天机器人,每次都必须手动检查输出的事实?有一些方法
阅读全文
posted @ 2024-01-03 09:41 deephub
阅读(130)
评论(0)
推荐(0)
2024年1月2日
加速Python循环的12种方法,最高可以提速900倍
摘要: 在本文中,我将介绍一些简单的方法,可以将Python for循环的速度提高1.3到900倍。 Python内建的一个常用功能是timeit模块。下面几节中我们将使用它来度量循环的当前性能和改进后的性能。 对于每种方法,我们通过运行测试来建立基线,该测试包括在10次测试运行中运行被测函数100K次(循
阅读全文
posted @ 2024-01-02 10:49 deephub
阅读(101)
评论(0)
推荐(0)
2024年1月1日
Jupyter Notebook的10个常用扩展介绍
摘要: Jupyter Notebook(前身为IPython Notebook)是一种开源的交互式计算和数据可视化的工具,广泛用于数据科学、机器学习、科学研究和教育等领域。它提供了一个基于Web的界面,允许用户创建和共享文档,这些文档包含实时代码、方程、可视化和文本。 在数据科学和人工智能领域,Jupyt
阅读全文
posted @ 2024-01-01 09:58 deephub
阅读(171)
评论(0)
推荐(0)
上一页
1
···
67
68
69
70
71
72
73
74
75
···
147
下一页
公告