上一页 1 ··· 68 69 70 71 72 73 74 75 76 ··· 139 下一页
摘要: XGBoost是处理不同类型表格数据的最著名的算法,LightGBM 和Catboost也是为了修改他的缺陷而发布的。9月12日XGBoost发布了新的2.0版,本文除了介绍让XGBoost的完整历史以外,还将介绍新机制和更新。 这是一篇很长的文章,因为我们首先从梯度增强决策树开始。 基于树的方法, 阅读全文
posted @ 2023-10-08 09:46 deephub 阅读(105) 评论(0) 推荐(0)
摘要: NHWC和NCHW是卷积神经网络(cnn)中广泛使用的数据格式。它们决定了多维数据,如图像、点云或特征图如何存储在内存中。 NHWC(样本数,高度,宽度,通道):这种格式存储数据通道在最后,是TensorFlow的默认格式。 NCHW(样本数,通道,高度,宽度):通道位于高度和宽度尺寸之前,经常与P 阅读全文
posted @ 2023-10-07 09:30 deephub 阅读(152) 评论(0) 推荐(0)
摘要: 麻省理工学院和香港中文大学推出了LongLoRA,这是一种革命性的微调方法,可以在不需要大量计算资源的情况下提高大量预训练语言模型的上下文能力。 LongLoRA是一种新方法,它使改进大型语言计算机程序变得更容易,成本更低。训练LLM往往需要大量信息和花费大量的时间和计算机能力。使用大量数据(上下文 阅读全文
posted @ 2023-09-30 09:31 deephub 阅读(64) 评论(0) 推荐(0)
摘要: 数据不平衡是机器学习中一个常见的挑战,其中一个类的数量明显超过其他类,这可能导致有偏见的模型和较差的泛化。有各种Python库来帮助有效地处理不平衡数据。在本文中,我们将介绍用于处理机器学习中不平衡数据的十大Python库,并为每个库提供代码片段和解释。 https://avoid.overfit. 阅读全文
posted @ 2023-09-29 09:35 deephub 阅读(13) 评论(0) 推荐(0)
摘要: 本文介绍如何使用高斯混合模型将一维多模态分布拆分为多个分布。 高斯混合模型(Gaussian Mixture Models,简称GMM)是一种在统计和机器学习领域中常用的概率模型,用于对复杂数据分布进行建模和分析。GMM 是一种生成模型,它假设观测数据是由多个高斯分布组合而成的,每个高斯分布称为一个 阅读全文
posted @ 2023-09-28 09:02 deephub 阅读(78) 评论(0) 推荐(0)
摘要: 我们都知道Transformers相对于CNN的架构效率并不高,这导致在一些边缘设备进行推理时延迟会很高,所以这次介绍的论文EfficientFormer号称在准确率不降低的同时可以达到MobileNet的推理速度。 Transformers能否在获得高性能的同时,跑得和MobileNet一样快?为 阅读全文
posted @ 2023-09-26 09:55 deephub 阅读(37) 评论(0) 推荐(0)
摘要: 这是一篇很有意思的论文,他基于心音信号的对数谱图,提出了两种心率音分类模型,我们都知道:频谱图在语音识别上是广泛应用的,这篇论文将心音信号作为语音信号处理,并且得到了很好的效果。 对心音信号进行一致长度的分帧,提取其对数谱图特征,论文提出了长短期记忆(LSTM)和卷积神经网络(CNN)两种深度学习模 阅读全文
posted @ 2023-09-25 09:04 deephub 阅读(52) 评论(0) 推荐(0)
摘要: 本文将介绍3个在数据集中查找离群值的Python方法 离群值(Outliers)是指在数据集中与其他数据点明显不同或者异常的数据点。这些数据点可能比其他数据点要远离数据集的中心,或者具有异常的数值。离群值可能是由于数据采集错误、异常事件、测量误差或者其他未知因素引起的。 离群值的存在可以对数据分析和 阅读全文
posted @ 2023-09-24 09:27 deephub 阅读(74) 评论(0) 推荐(0)
摘要: 相关系数矩阵(Correlation matrix)是数据分析的基本工具。它们让我们了解不同的变量是如何相互关联的。在Python中,有很多个方法可以计算相关系数矩阵,今天我们来对这些方法进行一个总结 Pandas Pandas的DataFrame对象可以使用corr方法直接创建相关矩阵。由于数据科 阅读全文
posted @ 2023-09-23 09:13 deephub 阅读(152) 评论(0) 推荐(0)
摘要: 使用QLoRA对Llama 2进行微调是我们常用的一个方法,但是在微调时会遇到各种各样的问题,所以在本文中,将尝试以详细注释的方式给出一些常见问题的答案。这些问题是特定于代码的,大多数注释都是针对所涉及的开源库以及所使用的方法和类的问题。 https://avoid.overfit.cn/post/ 阅读全文
posted @ 2023-09-21 11:22 deephub 阅读(163) 评论(0) 推荐(0)
上一页 1 ··· 68 69 70 71 72 73 74 75 76 ··· 139 下一页