上一页 1 ··· 134 135 136 137 138 139 140 141 142 ··· 155 下一页
摘要: 机器学习和深度学习中的模型都是遵循数学函数的方式创建的。从数据分析到预测建模,一般情况下都会有数学原理的支撑,比如:欧几里得距离用于检测聚类中的聚类。 傅里叶变换是一种众将函数从一个域转换到另一个域的数学方法,它也可以应用于深度学习。 本文将讨论傅里叶变换,以及如何将其用于深度学习领域。 什么是傅里 阅读全文
posted @ 2022-05-06 11:35 deephub 阅读(107) 评论(0) 推荐(0)
摘要: 为什么要增加训练数据 机器学习中的数据增强主要通过人工构建数据,增加训练集的大小使模型达到更好的泛化特性。这是一个在机器学习学科中进行的广泛研究的研究领域。 数据增强的主要作用如下: 增加了模型的概括功能; 对于不平衡数据集很有用; 可以最大程度地减少标注工作; 提高了针对对抗性攻击的健壮性; 一般 阅读全文
posted @ 2022-05-05 11:02 deephub 阅读(230) 评论(0) 推荐(0)
摘要: Micro-Outlier Removal:这个词听起来不错。但是这个术语是本文的作者首创的。所以应该找不到其他相关的资料,但是看完本篇文章你就可以了解这个词的含义。 在Kaggle 的《Titanic》排行榜中,作者使用这项技术获得了巨大排名飞跃- 在使用这个技术之前排名是12616 使用这个技术 阅读全文
posted @ 2022-05-04 17:25 deephub 阅读(201) 评论(0) 推荐(0)
摘要: 分箱是一种常见的数据预处理技术有时也被称为分桶或离散化,他可用于将连续数据的间隔分组到“箱”或“桶”中。在本文中,我们将讨论使用 python Pandas 库对数值进行分箱的 4 种方法。 我们创建以下合成数据用于演示 import pandas as pd # version 1.3.5 imp 阅读全文
posted @ 2022-05-03 10:52 deephub 阅读(211) 评论(0) 推荐(0)
摘要: 1、Hybridised Loss Functions for Improved Neural Network Generalisation Matthew C. Dickson, Anna S. Bosman, Katherine M. Malan https://arxiv.org/pdf/22 阅读全文
posted @ 2022-05-02 10:28 deephub 阅读(236) 评论(0) 推荐(0)
摘要: 在 SimCLS [2]论文发布后不久,作者又发布了抽象文本摘要任务的SOTA结果 [1]。BRIO在上述论文的基础上结合了对比学习范式。 BRIO解决什么问题? 上图显示 seq2seq 架构中使用的传统 MLE 损失与无参考对比损失之间的差异。 我们通常使用最大似然估计(Maximum Like 阅读全文
posted @ 2022-05-01 10:04 deephub 阅读(236) 评论(0) 推荐(0)
摘要: 数据可视化基本上是数据的图形表示。在探索性数据分析中,可以使用数据可视化来理解变量之间的关系,还可以通过视化数据揭示底层结构或了解数据信息。 有多种工具可以帮助我们创建数据可视化。Seaborn就是其中之一 ,它是一个流行的 Python 数据可视化库。虽然Seaborn也是基于 Matplotli 阅读全文
posted @ 2022-04-30 13:25 deephub 阅读(140) 评论(0) 推荐(0)
摘要: 太多的特征会增加模型的复杂性和过拟合,而太少的特征会导致模型的拟合不足。将模型优化为足够复杂以使其性能可推广,但又足够简单易于训练、维护和解释是特征选择的主要工作。 “特征选择”意味着可以保留一些特征并放弃其他一些特征。本文的目的是概述一些特征选择策略: 删除未使用的列 删除具有缺失值的列 不相关的 阅读全文
posted @ 2022-04-29 11:20 deephub 阅读(279) 评论(0) 推荐(0)
摘要: 4月25日(星期一)至4月29日(星期五),International Conference in Learning Representations(ICLR)将连续第三年在线举行。它是世界机器学习研究世界上最大,最受欢迎的会议之一:它包含超过一千篇有关主题的论文,包括ML理论,强化学习(RL),计 阅读全文
posted @ 2022-04-28 10:51 deephub 阅读(220) 评论(0) 推荐(0)
摘要: 训练深度神经网络是一项具有挑战性的任务。多年来,研究人员提出了不同的方法来加速和稳定学习过程。归一化是一种被证明在这方面非常有效的技术。 在这篇文章中,我将使用类比和可视化的方式来回顾这些方法中,这将帮助您了解它们的产生的原因和思维过程。 为什么要归一化? 例如,我们现在用两个特征构建一个简单的神经 阅读全文
posted @ 2022-04-27 10:23 deephub 阅读(350) 评论(0) 推荐(0)
上一页 1 ··· 134 135 136 137 138 139 140 141 142 ··· 155 下一页