会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
134
135
136
137
138
139
140
141
142
···
155
下一页
2022年5月6日
神经网络与傅立叶变换有关系吗?
摘要: 机器学习和深度学习中的模型都是遵循数学函数的方式创建的。从数据分析到预测建模,一般情况下都会有数学原理的支撑,比如:欧几里得距离用于检测聚类中的聚类。 傅里叶变换是一种众将函数从一个域转换到另一个域的数学方法,它也可以应用于深度学习。 本文将讨论傅里叶变换,以及如何将其用于深度学习领域。 什么是傅里
阅读全文
posted @ 2022-05-06 11:35 deephub
阅读(107)
评论(0)
推荐(0)
2022年5月5日
5分钟NLP:文本分类任务中的数据增强技术
摘要: 为什么要增加训练数据 机器学习中的数据增强主要通过人工构建数据,增加训练集的大小使模型达到更好的泛化特性。这是一个在机器学习学科中进行的广泛研究的研究领域。 数据增强的主要作用如下: 增加了模型的概括功能; 对于不平衡数据集很有用; 可以最大程度地减少标注工作; 提高了针对对抗性攻击的健壮性; 一般
阅读全文
posted @ 2022-05-05 11:02 deephub
阅读(230)
评论(0)
推荐(0)
2022年5月4日
https://avoid.overfit.cn/post/36a2d8369c6241f0aa7c5331e110336c
摘要: Micro-Outlier Removal:这个词听起来不错。但是这个术语是本文的作者首创的。所以应该找不到其他相关的资料,但是看完本篇文章你就可以了解这个词的含义。 在Kaggle 的《Titanic》排行榜中,作者使用这项技术获得了巨大排名飞跃- 在使用这个技术之前排名是12616 使用这个技术
阅读全文
posted @ 2022-05-04 17:25 deephub
阅读(201)
评论(0)
推荐(0)
2022年5月3日
Pandas 对数值进行分箱操作的4种方法总结对比
摘要: 分箱是一种常见的数据预处理技术有时也被称为分桶或离散化,他可用于将连续数据的间隔分组到“箱”或“桶”中。在本文中,我们将讨论使用 python Pandas 库对数值进行分箱的 4 种方法。 我们创建以下合成数据用于演示 import pandas as pd # version 1.3.5 imp
阅读全文
posted @ 2022-05-03 10:52 deephub
阅读(211)
评论(0)
推荐(0)
2022年5月2日
2022年关于损失函数的5篇最新论文推荐
摘要: 1、Hybridised Loss Functions for Improved Neural Network Generalisation Matthew C. Dickson, Anna S. Bosman, Katherine M. Malan https://arxiv.org/pdf/22
阅读全文
posted @ 2022-05-02 10:28 deephub
阅读(236)
评论(0)
推荐(0)
2022年5月1日
BRIO:抽象文本摘要任务新的SOTA模型
摘要: 在 SimCLS [2]论文发布后不久,作者又发布了抽象文本摘要任务的SOTA结果 [1]。BRIO在上述论文的基础上结合了对比学习范式。 BRIO解决什么问题? 上图显示 seq2seq 架构中使用的传统 MLE 损失与无参考对比损失之间的差异。 我们通常使用最大似然估计(Maximum Like
阅读全文
posted @ 2022-05-01 10:04 deephub
阅读(236)
评论(0)
推荐(0)
2022年4月30日
1行代码完成可视化:Seaborn3个常用方法示例
摘要: 数据可视化基本上是数据的图形表示。在探索性数据分析中,可以使用数据可视化来理解变量之间的关系,还可以通过视化数据揭示底层结构或了解数据信息。 有多种工具可以帮助我们创建数据可视化。Seaborn就是其中之一 ,它是一个流行的 Python 数据可视化库。虽然Seaborn也是基于 Matplotli
阅读全文
posted @ 2022-04-30 13:25 deephub
阅读(140)
评论(0)
推荐(0)
2022年4月29日
特征选择:11 种特征选择策略总结
摘要: 太多的特征会增加模型的复杂性和过拟合,而太少的特征会导致模型的拟合不足。将模型优化为足够复杂以使其性能可推广,但又足够简单易于训练、维护和解释是特征选择的主要工作。 “特征选择”意味着可以保留一些特征并放弃其他一些特征。本文的目的是概述一些特征选择策略: 删除未使用的列 删除具有缺失值的列 不相关的
阅读全文
posted @ 2022-04-29 11:20 deephub
阅读(279)
评论(0)
推荐(0)
2022年4月28日
ICLR 2022的10篇论文推荐
摘要: 4月25日(星期一)至4月29日(星期五),International Conference in Learning Representations(ICLR)将连续第三年在线举行。它是世界机器学习研究世界上最大,最受欢迎的会议之一:它包含超过一千篇有关主题的论文,包括ML理论,强化学习(RL),计
阅读全文
posted @ 2022-04-28 10:51 deephub
阅读(220)
评论(0)
推荐(0)
2022年4月27日
深度学习中的归一化技术全面总结
摘要: 训练深度神经网络是一项具有挑战性的任务。多年来,研究人员提出了不同的方法来加速和稳定学习过程。归一化是一种被证明在这方面非常有效的技术。 在这篇文章中,我将使用类比和可视化的方式来回顾这些方法中,这将帮助您了解它们的产生的原因和思维过程。 为什么要归一化? 例如,我们现在用两个特征构建一个简单的神经
阅读全文
posted @ 2022-04-27 10:23 deephub
阅读(350)
评论(0)
推荐(0)
上一页
1
···
134
135
136
137
138
139
140
141
142
···
155
下一页
公告