会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
124
125
126
127
128
129
130
131
132
···
155
下一页
2022年8月14日
几行 Python 代码就可以提取数百个时间序列特征
摘要: 时间序列数据是随着时间的推移反复捕获的变量值,随着时间的推移可以产生一系列的按时间顺序索引的数据点。在时间序列中,数据具有自然的时间顺序,即一个变量在特定时间的值依赖于过去的值。 传统的机器学习算法不能捕捉时间序列数据的时间顺序。数据科学家需要执行相关的特征工程,将数据的重要特征捕获到几个指标中。生
阅读全文
posted @ 2022-08-14 08:50 deephub
阅读(334)
评论(0)
推荐(0)
2022年8月13日
5个例子学会Pandas中的字符串过滤
摘要: 要处理文本数据,需要比数字类型的数据更多的清理步骤。为了从文本数据中提取有用和信息,通常需要执行几个预处理和过滤步骤。 Pandas 库有许多可以轻松简单地处理文本数据函数和方法。在本文中,我介绍将学习 5 种可用于过滤文本数据(即字符串)的不同方法: 是否包含一系列字符 求字符串的长度 判断以特定
阅读全文
posted @ 2022-08-13 09:11 deephub
阅读(144)
评论(0)
推荐(0)
2022年8月12日
CVPR 2022上人脸识别相关的论文分类整理
摘要: 人脸识别是AI研究的一个重要的方向,CVPR 2022也有很多相关的论文,本篇文章将针对不同的应用分类进行整理,希望对你有帮助 人脸识别 人脸识是一个热门话题,在当前的基准测试中要以相当大的提升击败 现有的SOTA模型变得越来越困难。 越来越多的开放数据可以用于训练,在百万级规模的数据上进行训练的一
阅读全文
posted @ 2022-08-12 10:57 deephub
阅读(372)
评论(0)
推荐(0)
2022年8月11日
你的模型是最好的还是最幸运的?选择最佳模型时如何避免随机性
摘要: kaggle比赛里经常会发生shake up的现象,说的直接点就是在有切榜或多榜单的比赛中,可能存在榜单排名激烈震动的情况,例如下面这个例子:Data Science Bowl 2017 我们看到,第一名是从公榜上升了130多名,而第5名则上升了349. 公榜结果就是好的模型私榜不一定就好,因为Ka
阅读全文
posted @ 2022-08-11 11:08 deephub
阅读(100)
评论(0)
推荐(0)
2022年8月10日
2022年8月的10篇论文推荐
摘要: 很久没有推荐论文了,但是在推荐新论文之前,首先推荐一个新闻: 谷歌分享了公司内部如何使用代码生成案例,3%的新代码是由语言模型(Language Model)、DeepSpeed (DeepSpeed)编写的,通过语言模型生成代码的智能建议,建议接受率约为25%,减少了6%的编码迭代时间,平均每个接
阅读全文
posted @ 2022-08-10 11:16 deephub
阅读(289)
评论(0)
推荐(0)
2022年8月9日
DALL·E-2是如何工作的以及部署自己的DALL·E模型
摘要: DALL·E-2可以通过自然语言的描述创建现实的图像。 Openai发布了dall·e-2的Beta版。 在本文中,我们将仔细研究DALL·E-2的原始研究论文,并了解其确切的工作方式。由于并没有开放源代码, Boris Dayma等人根据论文创建了一个迷你但是开源的模型Dall·E Mini(命名
阅读全文
posted @ 2022-08-09 13:39 deephub
阅读(667)
评论(0)
推荐(0)
2022年8月8日
7个步骤详解AdaBoost 算法原理和构建流程
摘要: AdaBoost 是集成学习中的一个常见的算法,它模仿“群体智慧”的原理:将单独表现不佳的模型组合起来可以形成一个强大的模型。 麻省理工学院(MIT) 2021年发表的一项研究[Diz21]描述了人们如何识别假新闻。如果没有背景知识或事实的核查,人们往往很难识别假新闻。但是根据不同人的经验,通常可以
阅读全文
posted @ 2022-08-08 11:30 deephub
阅读(313)
评论(0)
推荐(0)
2022年8月7日
更简单的掩码图像建模框架SimMIM介绍和PyTorch代码实现
摘要: MAE发布以来,各种使用掩码技术的自监督掩码模型在其基础之上有了更进一步的研究。在本文中我们将探索一篇和MAE同期的工作:SimMIM: A Simple Framework for Masked Image Modeling,研究团队是微软亚研院,并在PyTorch中编写它,最后我们也会提供相关的
阅读全文
posted @ 2022-08-07 10:16 deephub
阅读(219)
评论(0)
推荐(0)
2022年8月6日
10个自动EDA库功能介绍:几行代码进行的数据分析靠不靠谱
摘要: 探索性数据分析是数据科学模型开发和数据集研究的重要组成部分之一。在拿到一个新数据集时首先就需要花费大量时间进行EDA来研究数据集中内在的信息。自动化的EDA软件包可以用几行Python代码执行EDA。在本文中整理了10个可以自动执行EDA并生成有关数据的见解的软件包,看看他们都有什么功能,能在多大程
阅读全文
posted @ 2022-08-06 10:38 deephub
阅读(157)
评论(0)
推荐(0)
2022年8月5日
8个常见的机器学习算法的计算复杂度总结
摘要: 计算的复杂度是一个特定算法在运行时所消耗的计算资源(时间和空间)的度量。 计算复杂度又分为两类: 1、时间复杂度 时间复杂度不是测量一个算法或一段代码在某个机器或者条件下运行所花费的时间。时间复杂度一般指时间复杂性,时间复杂度是一个函数,它定性描述该算法的运行时间,允许我们在不运行它们的情况下比较不
阅读全文
posted @ 2022-08-05 10:50 deephub
阅读(171)
评论(0)
推荐(0)
上一页
1
···
124
125
126
127
128
129
130
131
132
···
155
下一页
公告