deephub

2023年2月10日

摘要：评估指标是用于评估机器学习模型性能的定量指标。它们提供了一种系统和客观的方法来比较不同的模型并衡量它们在解决特定问题方面的成功程度。通过比较不同模型的结果并评估其性能可以对使用哪些模型、如何改进现有模型以及如何优化给定任务的性能做出正确的决定，所以评估指标在机器学习模型的开发和部署中发挥着至关重要的阅读全文

posted @ 2023-02-10 11:02 deephub 阅读(56) 评论(0) 推荐(0)

2023年2月9日

如何解决混合精度训练大模型的局限性问题

摘要：混合精度已经成为训练大型深度学习模型的必要条件，但也带来了许多挑战。将模型参数和梯度转换为较低精度数据类型（如FP16）可以加快训练速度，但也会带来数值稳定性的问题。使用进行FP16 训练梯度更容易溢出或不足，导致优化器计算不精确，以及产生累加器超出数据类型范围的等问题。在这篇文章中，我们将讨论混阅读全文

posted @ 2023-02-09 11:30 deephub 阅读(199) 评论(0) 推荐(0)

2023年2月8日

Numpy中数组和矩阵操作的数学函数

摘要： Numpy 是一个强大的 Python 计算库。它提供了广泛的数学函数，可以对数组和矩阵执行各种操作。本文中将整理一些基本和常用的数学操作。基本数学运算：Numpy 提供了许多基本数学函数，用于对数组执行加、减、乘、除等运算。这些函数包括 numpy.add()、numpy.subtract()、阅读全文

posted @ 2023-02-08 10:19 deephub 阅读(65) 评论(0) 推荐(0)

2023年2月7日

3个用于时间序列数据整理的Pandas函数

摘要：本文将演示 3 个处理时间序列数据最常用的 pandas 操作首先我们要导入需要的库： importpandasaspd importnumpyasnp importmatplotlib.pyplotasplt 本文使用的数据集非常简单。它只有 1 列，名为 VPact (mbar)，表示气候中的阅读全文

posted @ 2023-02-07 11:20 deephub 阅读(52) 评论(0) 推荐(0)

2023年2月6日

使用JAX实现完整的Vision Transformer

摘要：本文将展示如何使用JAX/Flax实现Vision Transformer (ViT)，以及如何使用JAX/Flax训练ViT。 Vision Transformer 在实现Vision Transformer时，首先要记住这张图。以下是论文描述的ViT执行过程。从输入图像中提取补丁图像，并将其阅读全文

posted @ 2023-02-06 12:42 deephub 阅读(119) 评论(0) 推荐(0)

2023年2月5日

摘要：混合模型ACmix将自注意与卷积的整合，同时具有自注意和卷积的优点。这是清华大学、华为和北京人工智能研究院共同发布在2022年CVPR中的论文卷积分解与自注意力卷积分解标准卷积: https://avoid.overfit.cn/post/a56a24e0637e4ae38d1e2459a1d 阅读全文

posted @ 2023-02-05 10:31 deephub 阅读(143) 评论(0) 推荐(0)

2023年2月4日

使用谱聚类（spectral clustering）进行特征选择

摘要：在本文中，我们将介绍一种从相关特征的高维数据中选择或提取特征的有用方法。谱聚类是一种基于图论的聚类方法，通过对样本数据的拉普拉斯矩阵的特征向量进行聚类，从而达到对样本数据聚类的目的。谱聚类可以理解为将高维空间的数据映射到低维，然后在低维空间用其它聚类算法（如KMeans）进行聚类本文使用2021 阅读全文

posted @ 2023-02-04 10:37 deephub 阅读(137) 评论(0) 推荐(0)

2023年2月3日

Pandas的apply, map, transform介绍和性能测试

摘要： apply函数是我们经常用到的一个Pandas操作。虽然这在较小的数据集上不是问题，但在处理大量数据时，由此引起的性能问题会变得更加明显。虽然apply的灵活性使其成为一个简单的选择，但本文介绍了其他Pandas函数作为潜在的替代方案。在这篇文章中，我们将通过一些示例讨论apply、agg、map 阅读全文

posted @ 2023-02-03 09:53 deephub 阅读(99) 评论(0) 推荐(0)

2023年2月2日

2023 年 1 月的5篇深度学习论文推荐

摘要：本文整理了 2023 年 1 月5 篇著名的 AI 论文，涵盖了计算机视觉、自然语言处理等方面的新研究。 InstructPix2Pix: Learning to Follow Image Editing Instructions 伯克利分校的研究人员开发了一种使用人工指令编辑图像的新方法。通过结合阅读全文

posted @ 2023-02-02 10:50 deephub 阅读(282) 评论(0) 推荐(0)

2023年2月1日

在 PyTorch 中使用梯度检查点在GPU 上训练更大的模型

摘要：作为机器学习从业者，我们经常会遇到这样的情况，想要训练一个比较大的模型，而 GPU 却因为内存不足而无法训练它。当我们在出于安全原因不允许在云计算的环境中工作时，这个问题经常会出现。在这样的环境中，我们无法足够快地扩展或切换到功能强大的硬件并训练模型。并且由于梯度下降算法的性质，通常较大的批次在大多阅读全文

posted @ 2023-02-01 11:09 deephub 阅读(137) 评论(0) 推荐(0)

overfit深度学习

公告