会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
88
89
90
91
92
93
94
95
96
···
154
下一页
2023年8月6日
Pandas 的Merge函数详解
摘要: 在日常工作中,我们可能会从多个数据集中获取数据,并且希望合并两个或多个不同的数据集。这时就可以使用Pandas包中的Merge函数。在本文中,我们将介绍用于合并数据的三个函数 merge 、 merge_ordered 、 merge_asof https://avoid.overfit.cn/po
阅读全文
posted @ 2023-08-06 10:47 deephub
阅读(198)
评论(0)
推荐(0)
2023年8月5日
在消费级GPU调试LLM的三种方法:梯度检查点,LoRA和量化
摘要: LLM的问题就是权重参数太大,无法在我们本地消费级GPU上进行调试,所以我们将介绍3种在训练过程中减少内存消耗,节省大量时间的方法:梯度检查点,LoRA和量化。 梯度检查点 梯度检查点是一种在神经网络训练过程中使动态计算只存储最小层数的技术。 为了理解这个过程,我们需要了解反向传播是如何执行的,以及
阅读全文
posted @ 2023-08-05 09:59 deephub
阅读(114)
评论(0)
推荐(0)
2023年8月4日
使用 CausalPy 进行因果推理
摘要: 这篇文章通过一个实际的例子简要介绍了因果推理,这个例子来自于《The Brave and True》一书,我们使用 CausalPy 来实现。 因果推理是从观察数据中估计因果效应的过程。对于任何给定的个体,我们只能观察到一种结果。另一种结果对我们来说是隐藏的。这就是所谓的反事实(即与事实相反)。例如
阅读全文
posted @ 2023-08-04 09:58 deephub
阅读(115)
评论(0)
推荐(0)
2023年8月3日
TabR:检索增强能否让深度学习在表格数据上超过梯度增强模型?
摘要: 这是一篇7月新发布的论文,他提出了使用自然语言处理的检索增强Retrieval Augmented技术,目的是让深度学习在表格数据上超过梯度增强模型。 检索增强一直是NLP中研究的一个方向,但是引入了检索增强的表格深度学习模型在当前实现与非基于检索的模型相比几乎没有改进。所以论文作者提出了一个新的T
阅读全文
posted @ 2023-08-03 09:34 deephub
阅读(67)
评论(0)
推荐(0)
2023年8月2日
10个简单但很有用的Python装饰器
摘要: 装饰器(Decorators)是Python中一种强大而灵活的功能,用于修改或增强函数或类的行为。装饰器本质上是一个函数,它接受另一个函数或类作为参数,并返回一个新的函数或类。它们通常用于在不修改原始代码的情况下添加额外的功能或功能。 装饰器的语法使用 @ 符号,将装饰器应用于目标函数或类。下面我们
阅读全文
posted @ 2023-08-02 09:32 deephub
阅读(75)
评论(0)
推荐(0)
2023年7月31日
SDXL 1.0 介绍和优缺点总结
摘要: 2023年7月26日:Stability. AI 发布SDXL 1.0,这是对其生成模型的又一次重大更新,带来了突破性的变化。 SDXL 1.0包括两种不同的模型: sdxml -base-1.0:生成1024 x 1024图像的基本文本到图像模型。基本模型使用OpenCLIP-ViT/G和CLIP
阅读全文
posted @ 2023-07-31 09:22 deephub
阅读(386)
评论(0)
推荐(0)
2023年7月30日
因子分解机介绍和PyTorch代码实现
摘要: 因子分解机(Factorization Machines,简称FM)是一种用于解决推荐系统、回归和分类等机器学习任务的模型。它由Steffen Rendle于2010年提出,是一种基于线性模型的扩展方法,能够有效地处理高维稀疏数据,并且在处理特征组合时表现出色。它是推荐系统的经典模型之一,并且模型简
阅读全文
posted @ 2023-07-30 11:21 deephub
阅读(115)
评论(0)
推荐(0)
2023年7月29日
Meta-Transformer 多模态学习的统一框架
摘要: Meta-Transformer是一个用于多模态学习的新框架,用来处理和关联来自多种模态的信息,如自然语言、图像、点云、音频、视频、时间序列和表格数据,虽然各种数据之间存在固有的差距,但是Meta-Transformer利用冻结编码器从共享标记空间的输入数据中提取高级语义特征,不需要配对的多模态训练
阅读全文
posted @ 2023-07-29 11:17 deephub
阅读(135)
评论(0)
推荐(0)
2023年7月28日
图注意力网络论文详解和PyTorch实现
摘要: 图神经网络(gnn)是一类功能强大的神经网络,它对图结构数据进行操作。它们通过从节点的局部邻域聚合信息来学习节点表示(嵌入)。这个概念在图表示学习文献中被称为“消息传递”。 消息(嵌入)通过多个GNN层在图中的节点之间传递。每个节点聚合来自其邻居的消息以更新其表示。这个过程跨层重复,允许节点获得编码
阅读全文
posted @ 2023-07-28 12:59 deephub
阅读(235)
评论(0)
推荐(0)
2023年7月27日
DeepSpeed-MoE:训练更大及更复杂的混合专家网络
摘要: 这是微软发布在2022 ICML的论文,MoE可以降低训练成本,但是快速的MoE模型推理仍然是一个未解决的问题。所以论文提出了一个端到端的MoE训练和推理解决方案DeepSpeed-MoE:它包括新颖的MoE架构设计和模型压缩技术,可将MoE模型大小减少3.7倍;通过高度优化的推理系统,减少了7.3
阅读全文
posted @ 2023-07-27 09:56 deephub
阅读(189)
评论(0)
推荐(0)
上一页
1
···
88
89
90
91
92
93
94
95
96
···
154
下一页
公告