会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
67
68
69
70
71
72
73
74
75
···
139
下一页
2023年10月19日
LSTM-CRF模型详解和Pytorch代码实现
摘要: 在快速发展的自然语言处理领域,Transformers 已经成为主导模型,在广泛的序列建模任务中表现出卓越的性能,包括词性标记、命名实体识别和分块。在Transformers之前,条件随机场(CRFs)是序列建模的首选工具,特别是线性链CRFs,它将序列建模为有向图,而CRFs更普遍地可以用于任意图
阅读全文
posted @ 2023-10-19 11:22 deephub
阅读(256)
评论(0)
推荐(0)
2023年10月18日
TSMixer:谷歌发布的用于时间序列预测的全新全mlp架构
摘要: 这是谷歌在9月最近发布的一种新的架构 TSMixer: An all-MLP architecture for time series forecasting ,TSMixer是一种先进的多元模型,利用线性模型特征,在长期预测基准上表现良好。据我们所知,TSMixer是第一个在长期预测基准上表现与最
阅读全文
posted @ 2023-10-18 09:42 deephub
阅读(137)
评论(0)
推荐(0)
2023年10月17日
使用Pytorch实现频谱归一化生成对抗网络(SN-GAN)
摘要: 自从扩散模型发布以来,GAN的关注度和论文是越来越少了,但是它们里面的一些思路还是值得我们了解和学习。所以本文我们来使用Pytorch 来实现SN-GAN 谱归一化生成对抗网络是一种生成对抗网络,它使用谱归一化技术来稳定鉴别器的训练。谱归一化是一种权值归一化技术,它约束了鉴别器中每一层的谱范数。这有
阅读全文
posted @ 2023-10-17 12:30 deephub
阅读(102)
评论(0)
推荐(0)
2023年10月16日
使用轮廓分数提升时间序列聚类的表现
摘要: 我们将使用轮廓分数和一些距离指标来执行时间序列聚类实验,并且进行可视化 让我们看看下面的时间序列: 如果沿着y轴移动序列添加随机噪声,并随机化这些序列,那么它们几乎无法分辨,如下图所示-现在很难将时间序列列分组为簇: 上面的图表是使用以下脚本创建的: https://avoid.overfit.cn
阅读全文
posted @ 2023-10-16 09:36 deephub
阅读(19)
评论(0)
推荐(0)
2023年10月15日
9月大型语言模型研究论文总结
摘要: 大型语言模型(llm)在今年发展迅速,随着新一代模型不断地被开发,研究人员和工程师了解最新进展变得非常重要。本文总结9-10月期间发布了一些重要的LLM论文。 这些论文涵盖了一系列语言模型的主题,从模型优化和缩放到推理、基准测试和增强性能。最后部分讨论了有关安全训练并确保其行为保持有益的论文。 优化
阅读全文
posted @ 2023-10-15 10:01 deephub
阅读(126)
评论(0)
推荐(0)
2023年10月14日
向量化操作简介和Pandas、Numpy示例
摘要: Pandas是一种流行的用于数据操作的Python库,它提供了一种称为“向量化”的强大技术可以有效地将操作应用于整个列或数据系列,从而消除了显式循环的需要。在本文中,我们将探讨什么是向量化,以及它如何简化数据分析任务。 https://avoid.overfit.cn/post/ae2f68c9b2
阅读全文
posted @ 2023-10-14 10:01 deephub
阅读(79)
评论(0)
推荐(0)
2023年10月13日
TimesNet:时间序列预测的最新模型
摘要: 2020年发布的N-BEATS、2022年发布的N-HiTS和2023年3月发布的PatchTST开始。N-BEATS和N-HiTS依赖于多层感知器架构,而PatchTST利用了Transformer架构。 2023年4月发表了一个新的模型,它在时间序列分析的多个任务中实现了最先进的结果,如预测、i
阅读全文
posted @ 2023-10-13 09:48 deephub
阅读(809)
评论(0)
推荐(0)
2023年10月11日
GPU 虚拟化技术MIG简介和安装使用教程
摘要: 使用多实例GPU (MIG/Multi-Instance GPU)可以将强大的显卡分成更小的部分,每个部分都有自己的工作,这样单张显卡可以同时运行不同的任务。本文将对其进行简单介绍并且提供安装和使用的示例。 什么是MIG NVIDIA Multi-Instance GPU (MIG) 技术是 NVI
阅读全文
posted @ 2023-10-11 09:36 deephub
阅读(231)
评论(0)
推荐(0)
2023年10月10日
常用的相似度度量总结:余弦相似度,点积,L1,L2
摘要: 相似性度量在机器学习中起着至关重要的作用。这些度量以数学方式量化对象、数据点或向量之间的相似性。理解向量空间中的相似性概念并采用适当的度量是解决广泛的现实世界问题的基础。本文将介绍几种常用的用来计算两个向量在嵌入空间中的接近程度的相似性度量。 https://avoid.overfit.cn/pos
阅读全文
posted @ 2023-10-10 09:49 deephub
阅读(141)
评论(0)
推荐(0)
2023年10月9日
三个主要降维技术对比介绍:PCA, LCA,SVD
摘要: 随着数据集的规模和复杂性的增长,特征或维度的数量往往变得难以处理,导致计算需求增加,潜在的过拟合和模型可解释性降低。降维技术提供了一种补救方法,它捕获数据中的基本信息,同时丢弃冗余或信息较少的特征。这个过程不仅简化了计算任务,还有助于可视化数据趋势,减轻维度诅咒的风险,并提高机器学习模型的泛化性能。
阅读全文
posted @ 2023-10-09 09:37 deephub
阅读(56)
评论(0)
推荐(0)
上一页
1
···
67
68
69
70
71
72
73
74
75
···
139
下一页
公告