上一页 1 ··· 67 68 69 70 71 72 73 74 75 ··· 139 下一页
摘要: 在快速发展的自然语言处理领域,Transformers 已经成为主导模型,在广泛的序列建模任务中表现出卓越的性能,包括词性标记、命名实体识别和分块。在Transformers之前,条件随机场(CRFs)是序列建模的首选工具,特别是线性链CRFs,它将序列建模为有向图,而CRFs更普遍地可以用于任意图 阅读全文
posted @ 2023-10-19 11:22 deephub 阅读(256) 评论(0) 推荐(0)
摘要: 这是谷歌在9月最近发布的一种新的架构 TSMixer: An all-MLP architecture for time series forecasting ,TSMixer是一种先进的多元模型,利用线性模型特征,在长期预测基准上表现良好。据我们所知,TSMixer是第一个在长期预测基准上表现与最 阅读全文
posted @ 2023-10-18 09:42 deephub 阅读(137) 评论(0) 推荐(0)
摘要: 自从扩散模型发布以来,GAN的关注度和论文是越来越少了,但是它们里面的一些思路还是值得我们了解和学习。所以本文我们来使用Pytorch 来实现SN-GAN 谱归一化生成对抗网络是一种生成对抗网络,它使用谱归一化技术来稳定鉴别器的训练。谱归一化是一种权值归一化技术,它约束了鉴别器中每一层的谱范数。这有 阅读全文
posted @ 2023-10-17 12:30 deephub 阅读(102) 评论(0) 推荐(0)
摘要: 我们将使用轮廓分数和一些距离指标来执行时间序列聚类实验,并且进行可视化 让我们看看下面的时间序列: 如果沿着y轴移动序列添加随机噪声,并随机化这些序列,那么它们几乎无法分辨,如下图所示-现在很难将时间序列列分组为簇: 上面的图表是使用以下脚本创建的: https://avoid.overfit.cn 阅读全文
posted @ 2023-10-16 09:36 deephub 阅读(19) 评论(0) 推荐(0)
摘要: 大型语言模型(llm)在今年发展迅速,随着新一代模型不断地被开发,研究人员和工程师了解最新进展变得非常重要。本文总结9-10月期间发布了一些重要的LLM论文。 这些论文涵盖了一系列语言模型的主题,从模型优化和缩放到推理、基准测试和增强性能。最后部分讨论了有关安全训练并确保其行为保持有益的论文。 优化 阅读全文
posted @ 2023-10-15 10:01 deephub 阅读(126) 评论(0) 推荐(0)
摘要: Pandas是一种流行的用于数据操作的Python库,它提供了一种称为“向量化”的强大技术可以有效地将操作应用于整个列或数据系列,从而消除了显式循环的需要。在本文中,我们将探讨什么是向量化,以及它如何简化数据分析任务。 https://avoid.overfit.cn/post/ae2f68c9b2 阅读全文
posted @ 2023-10-14 10:01 deephub 阅读(79) 评论(0) 推荐(0)
摘要: 2020年发布的N-BEATS、2022年发布的N-HiTS和2023年3月发布的PatchTST开始。N-BEATS和N-HiTS依赖于多层感知器架构,而PatchTST利用了Transformer架构。 2023年4月发表了一个新的模型,它在时间序列分析的多个任务中实现了最先进的结果,如预测、i 阅读全文
posted @ 2023-10-13 09:48 deephub 阅读(809) 评论(0) 推荐(0)
摘要: 使用多实例GPU (MIG/Multi-Instance GPU)可以将强大的显卡分成更小的部分,每个部分都有自己的工作,这样单张显卡可以同时运行不同的任务。本文将对其进行简单介绍并且提供安装和使用的示例。 什么是MIG NVIDIA Multi-Instance GPU (MIG) 技术是 NVI 阅读全文
posted @ 2023-10-11 09:36 deephub 阅读(231) 评论(0) 推荐(0)
摘要: 相似性度量在机器学习中起着至关重要的作用。这些度量以数学方式量化对象、数据点或向量之间的相似性。理解向量空间中的相似性概念并采用适当的度量是解决广泛的现实世界问题的基础。本文将介绍几种常用的用来计算两个向量在嵌入空间中的接近程度的相似性度量。 https://avoid.overfit.cn/pos 阅读全文
posted @ 2023-10-10 09:49 deephub 阅读(141) 评论(0) 推荐(0)
摘要: 随着数据集的规模和复杂性的增长,特征或维度的数量往往变得难以处理,导致计算需求增加,潜在的过拟合和模型可解释性降低。降维技术提供了一种补救方法,它捕获数据中的基本信息,同时丢弃冗余或信息较少的特征。这个过程不仅简化了计算任务,还有助于可视化数据趋势,减轻维度诅咒的风险,并提高机器学习模型的泛化性能。 阅读全文
posted @ 2023-10-09 09:37 deephub 阅读(56) 评论(0) 推荐(0)
上一页 1 ··· 67 68 69 70 71 72 73 74 75 ··· 139 下一页