上一页 1 ··· 108 109 110 111 112 113 114 115 116 ··· 138 下一页
摘要: AdaBoost 是集成学习中的一个常见的算法,它模仿“群体智慧”的原理:将单独表现不佳的模型组合起来可以形成一个强大的模型。 麻省理工学院(MIT) 2021年发表的一项研究[Diz21]描述了人们如何识别假新闻。如果没有背景知识或事实的核查,人们往往很难识别假新闻。但是根据不同人的经验,通常可以 阅读全文
posted @ 2022-08-08 11:30 deephub 阅读(288) 评论(0) 推荐(0)
摘要: MAE发布以来,各种使用掩码技术的自监督掩码模型在其基础之上有了更进一步的研究。在本文中我们将探索一篇和MAE同期的工作:SimMIM: A Simple Framework for Masked Image Modeling,研究团队是微软亚研院,并在PyTorch中编写它,最后我们也会提供相关的 阅读全文
posted @ 2022-08-07 10:16 deephub 阅读(197) 评论(0) 推荐(0)
摘要: 探索性数据分析是数据科学模型开发和数据集研究的重要组成部分之一。在拿到一个新数据集时首先就需要花费大量时间进行EDA来研究数据集中内在的信息。自动化的EDA软件包可以用几行Python代码执行EDA。在本文中整理了10个可以自动执行EDA并生成有关数据的见解的软件包,看看他们都有什么功能,能在多大程 阅读全文
posted @ 2022-08-06 10:38 deephub 阅读(141) 评论(0) 推荐(0)
摘要: 计算的复杂度是一个特定算法在运行时所消耗的计算资源(时间和空间)的度量。 计算复杂度又分为两类: 1、时间复杂度 时间复杂度不是测量一个算法或一段代码在某个机器或者条件下运行所花费的时间。时间复杂度一般指时间复杂性,时间复杂度是一个函数,它定性描述该算法的运行时间,允许我们在不运行它们的情况下比较不 阅读全文
posted @ 2022-08-05 10:50 deephub 阅读(137) 评论(0) 推荐(0)
摘要: 变分自编码器 (VAE) 是在图像数据应用中被提出,但VAE不仅可以应用在图像中。在这篇文章中,我们将简单介绍什么是VAE,以及解释“为什么”变分自编码器是可以应用在数值类型的数据上,最后使用Numerai数据集展示“如何”训练它。 Numerai数据集数据集包含全球股市数十年的历史数据,在Nume 阅读全文
posted @ 2022-08-04 10:39 deephub 阅读(357) 评论(0) 推荐(0)
摘要: 通过细胞图像的标签对模型性能的影响,为数据设置优先级和权重。 许多机器学习任务的主要障碍之一是缺乏标记数据。而标记数据可能会耗费很长的时间,并且很昂贵,因此很多时候尝试使用机器学习方法来解决问题是不合理的。 为了解决这个问题,机器学习领域出现了一个叫做主动学习的领域。主动学习是机器学习中的一种方法, 阅读全文
posted @ 2022-08-03 11:11 deephub 阅读(110) 评论(0) 推荐(0)
摘要: pandas.的query函数为我们提供了一种编写查询过滤条件更简单的方法,特别是在的查询条件很多的时候,在本文中整理了10个示例,掌握着10个实例你就可以轻松的使用query函数来解决任何查询的问题。 首先,将数据集导入pandas DataFrame - df import pandas as 阅读全文
posted @ 2022-08-02 11:28 deephub 阅读(123) 评论(0) 推荐(0)
摘要: 在分类任务中,不平衡数据集是指数据集中的分类不平均的情况,会有一个或多个类比其他类多的多或者少的多。 在我们的日常生活中,不平衡的数据是非常常见的比如本篇文章将使用一个最常见的例子,信用卡欺诈检测来介绍,在我们的日常使用中欺诈的数量要远比正常使用的数量少很多,对于我们来说这就是数据不平衡的问题。 我 阅读全文
posted @ 2022-08-01 10:42 deephub 阅读(89) 评论(0) 推荐(0)
摘要: 本文将介绍如何使用内存映射文件加快PyTorch数据集的加载速度 在使用Pytorch训练神经网络时,最常见的与速度相关的瓶颈是数据加载的模块。如果我们将数据通过网络传输,除了预取和缓存之外,没有任何其他的简单优化方式。 但是如果数据本地存储,我们可以通过将整个数据集组合成一个文件,然后映射到内存中 阅读全文
posted @ 2022-07-31 10:21 deephub 阅读(174) 评论(0) 推荐(0)
摘要: Python 可以说是最容易入门的编程语言,在numpy,scipy等基础包的帮助下,对于数据的处理和机器学习来说Python可以说是目前最好的语言,在各位大佬和热心贡献者的帮助下Python拥有一个庞大的社区支持技术发展,开发两个各种 Python 包来帮助数据人员的工作。 在本文中,将介绍一些非 阅读全文
posted @ 2022-07-30 10:20 deephub 阅读(110) 评论(0) 推荐(0)
上一页 1 ··· 108 109 110 111 112 113 114 115 116 ··· 138 下一页