deephub

2023年10月11日

摘要：使用多实例GPU (MIG/Multi-Instance GPU)可以将强大的显卡分成更小的部分，每个部分都有自己的工作，这样单张显卡可以同时运行不同的任务。本文将对其进行简单介绍并且提供安装和使用的示例。什么是MIG NVIDIA Multi-Instance GPU (MIG) 技术是 NVI 阅读全文

posted @ 2023-10-11 09:36 deephub 阅读(254) 评论(0) 推荐(0)

2023年10月10日

常用的相似度度量总结：余弦相似度，点积，L1，L2

摘要：相似性度量在机器学习中起着至关重要的作用。这些度量以数学方式量化对象、数据点或向量之间的相似性。理解向量空间中的相似性概念并采用适当的度量是解决广泛的现实世界问题的基础。本文将介绍几种常用的用来计算两个向量在嵌入空间中的接近程度的相似性度量。 https://avoid.overfit.cn/pos 阅读全文

posted @ 2023-10-10 09:49 deephub 阅读(145) 评论(0) 推荐(0)

2023年10月9日

三个主要降维技术对比介绍：PCA, LCA,SVD

摘要：随着数据集的规模和复杂性的增长，特征或维度的数量往往变得难以处理，导致计算需求增加，潜在的过拟合和模型可解释性降低。降维技术提供了一种补救方法，它捕获数据中的基本信息，同时丢弃冗余或信息较少的特征。这个过程不仅简化了计算任务，还有助于可视化数据趋势，减轻维度诅咒的风险，并提高机器学习模型的泛化性能。阅读全文

posted @ 2023-10-09 09:37 deephub 阅读(65) 评论(0) 推荐(0)

2023年10月8日

XGBoost 2.0:对基于树的方法进行了重大更新

摘要： XGBoost是处理不同类型表格数据的最著名的算法，LightGBM 和Catboost也是为了修改他的缺陷而发布的。9月12日XGBoost发布了新的2.0版，本文除了介绍让XGBoost的完整历史以外，还将介绍新机制和更新。这是一篇很长的文章，因为我们首先从梯度增强决策树开始。基于树的方法，阅读全文

posted @ 2023-10-08 09:46 deephub 阅读(110) 评论(0) 推荐(0)

2023年10月7日

从GPU的内存访问视角对比NHWC和NCHW

摘要： NHWC和NCHW是卷积神经网络(cnn)中广泛使用的数据格式。它们决定了多维数据，如图像、点云或特征图如何存储在内存中。 NHWC(样本数，高度，宽度，通道):这种格式存储数据通道在最后，是TensorFlow的默认格式。 NCHW(样本数，通道，高度，宽度):通道位于高度和宽度尺寸之前，经常与P 阅读全文

posted @ 2023-10-07 09:30 deephub 阅读(157) 评论(0) 推荐(0)

2023年9月30日

LongLoRA:不需要大量计算资源的情况下增强了预训练语言模型的上下文能力

摘要：麻省理工学院和香港中文大学推出了LongLoRA，这是一种革命性的微调方法，可以在不需要大量计算资源的情况下提高大量预训练语言模型的上下文能力。 LongLoRA是一种新方法，它使改进大型语言计算机程序变得更容易，成本更低。训练LLM往往需要大量信息和花费大量的时间和计算机能力。使用大量数据(上下文阅读全文

posted @ 2023-09-30 09:31 deephub 阅读(76) 评论(0) 推荐(0)

2023年9月29日

处理不平衡数据的十大Python库

摘要：数据不平衡是机器学习中一个常见的挑战，其中一个类的数量明显超过其他类，这可能导致有偏见的模型和较差的泛化。有各种Python库来帮助有效地处理不平衡数据。在本文中，我们将介绍用于处理机器学习中不平衡数据的十大Python库，并为每个库提供代码片段和解释。 https://avoid.overfit. 阅读全文

posted @ 2023-09-29 09:35 deephub 阅读(17) 评论(0) 推荐(0)

2023年9月28日

使用高斯混合模型拆分多模态分布

摘要：本文介绍如何使用高斯混合模型将一维多模态分布拆分为多个分布。高斯混合模型（Gaussian Mixture Models，简称GMM）是一种在统计和机器学习领域中常用的概率模型，用于对复杂数据分布进行建模和分析。GMM 是一种生成模型，它假设观测数据是由多个高斯分布组合而成的，每个高斯分布称为一个阅读全文

posted @ 2023-09-28 09:02 deephub 阅读(88) 评论(0) 推荐(0)

2023年9月26日

EfficientFormer:高效低延迟的Vision Transformers

摘要：我们都知道Transformers相对于CNN的架构效率并不高，这导致在一些边缘设备进行推理时延迟会很高，所以这次介绍的论文EfficientFormer号称在准确率不降低的同时可以达到MobileNet的推理速度。 Transformers能否在获得高性能的同时，跑得和MobileNet一样快?为阅读全文

posted @ 2023-09-26 09:55 deephub 阅读(45) 评论(0) 推荐(0)

2023年9月25日

基于对数谱图的深度学习心音分类

摘要：这是一篇很有意思的论文，他基于心音信号的对数谱图，提出了两种心率音分类模型，我们都知道：频谱图在语音识别上是广泛应用的，这篇论文将心音信号作为语音信号处理，并且得到了很好的效果。对心音信号进行一致长度的分帧，提取其对数谱图特征，论文提出了长短期记忆(LSTM)和卷积神经网络(CNN)两种深度学习模阅读全文

posted @ 2023-09-25 09:04 deephub 阅读(57) 评论(0) 推荐(0)

overfit深度学习

公告