上一页 1 ··· 82 83 84 85 86 87 88 89 90 ··· 154 下一页
摘要: 自从扩散模型发布以来,GAN的关注度和论文是越来越少了,但是它们里面的一些思路还是值得我们了解和学习。所以本文我们来使用Pytorch 来实现SN-GAN 谱归一化生成对抗网络是一种生成对抗网络,它使用谱归一化技术来稳定鉴别器的训练。谱归一化是一种权值归一化技术,它约束了鉴别器中每一层的谱范数。这有 阅读全文
posted @ 2023-10-17 12:30 deephub 阅读(120) 评论(0) 推荐(0)
摘要: 我们将使用轮廓分数和一些距离指标来执行时间序列聚类实验,并且进行可视化 让我们看看下面的时间序列: 如果沿着y轴移动序列添加随机噪声,并随机化这些序列,那么它们几乎无法分辨,如下图所示-现在很难将时间序列列分组为簇: 上面的图表是使用以下脚本创建的: https://avoid.overfit.cn 阅读全文
posted @ 2023-10-16 09:36 deephub 阅读(38) 评论(0) 推荐(0)
摘要: 大型语言模型(llm)在今年发展迅速,随着新一代模型不断地被开发,研究人员和工程师了解最新进展变得非常重要。本文总结9-10月期间发布了一些重要的LLM论文。 这些论文涵盖了一系列语言模型的主题,从模型优化和缩放到推理、基准测试和增强性能。最后部分讨论了有关安全训练并确保其行为保持有益的论文。 优化 阅读全文
posted @ 2023-10-15 10:01 deephub 阅读(167) 评论(0) 推荐(0)
摘要: Pandas是一种流行的用于数据操作的Python库,它提供了一种称为“向量化”的强大技术可以有效地将操作应用于整个列或数据系列,从而消除了显式循环的需要。在本文中,我们将探讨什么是向量化,以及它如何简化数据分析任务。 https://avoid.overfit.cn/post/ae2f68c9b2 阅读全文
posted @ 2023-10-14 10:01 deephub 阅读(103) 评论(0) 推荐(0)
摘要: 2020年发布的N-BEATS、2022年发布的N-HiTS和2023年3月发布的PatchTST开始。N-BEATS和N-HiTS依赖于多层感知器架构,而PatchTST利用了Transformer架构。 2023年4月发表了一个新的模型,它在时间序列分析的多个任务中实现了最先进的结果,如预测、i 阅读全文
posted @ 2023-10-13 09:48 deephub 阅读(880) 评论(0) 推荐(0)
摘要: 使用多实例GPU (MIG/Multi-Instance GPU)可以将强大的显卡分成更小的部分,每个部分都有自己的工作,这样单张显卡可以同时运行不同的任务。本文将对其进行简单介绍并且提供安装和使用的示例。 什么是MIG NVIDIA Multi-Instance GPU (MIG) 技术是 NVI 阅读全文
posted @ 2023-10-11 09:36 deephub 阅读(266) 评论(0) 推荐(0)
摘要: 相似性度量在机器学习中起着至关重要的作用。这些度量以数学方式量化对象、数据点或向量之间的相似性。理解向量空间中的相似性概念并采用适当的度量是解决广泛的现实世界问题的基础。本文将介绍几种常用的用来计算两个向量在嵌入空间中的接近程度的相似性度量。 https://avoid.overfit.cn/pos 阅读全文
posted @ 2023-10-10 09:49 deephub 阅读(159) 评论(0) 推荐(0)
摘要: 随着数据集的规模和复杂性的增长,特征或维度的数量往往变得难以处理,导致计算需求增加,潜在的过拟合和模型可解释性降低。降维技术提供了一种补救方法,它捕获数据中的基本信息,同时丢弃冗余或信息较少的特征。这个过程不仅简化了计算任务,还有助于可视化数据趋势,减轻维度诅咒的风险,并提高机器学习模型的泛化性能。 阅读全文
posted @ 2023-10-09 09:37 deephub 阅读(75) 评论(0) 推荐(0)
摘要: XGBoost是处理不同类型表格数据的最著名的算法,LightGBM 和Catboost也是为了修改他的缺陷而发布的。9月12日XGBoost发布了新的2.0版,本文除了介绍让XGBoost的完整历史以外,还将介绍新机制和更新。 这是一篇很长的文章,因为我们首先从梯度增强决策树开始。 基于树的方法, 阅读全文
posted @ 2023-10-08 09:46 deephub 阅读(123) 评论(0) 推荐(0)
摘要: NHWC和NCHW是卷积神经网络(cnn)中广泛使用的数据格式。它们决定了多维数据,如图像、点云或特征图如何存储在内存中。 NHWC(样本数,高度,宽度,通道):这种格式存储数据通道在最后,是TensorFlow的默认格式。 NCHW(样本数,通道,高度,宽度):通道位于高度和宽度尺寸之前,经常与P 阅读全文
posted @ 2023-10-07 09:30 deephub 阅读(170) 评论(0) 推荐(0)
上一页 1 ··· 82 83 84 85 86 87 88 89 90 ··· 154 下一页