上一页 1 ··· 138 139 140 141 142 143 144 145 146 ··· 155 下一页
摘要: 就像 20 世纪初,爱因斯坦的 Annus mirabilis 论文成为了量子力学的基础。只是这一次,是 AlexNet 论文 [1],这是一种挑战计算机视觉的架构,并重新唤起了人们对机器学习(后来转变为深度学习)的兴趣。在过去的十年里,人们见证了机器学习领域革命性的进步,这是无可否认的。 这种巨大 阅读全文
posted @ 2022-03-25 11:15 deephub 阅读(135) 评论(0) 推荐(0)
摘要: 对于图像相关的任务,对图像进行旋转、模糊或调整大小是常见的数据增强的方法。 因为图像的自身属性与其他数据类型数据增强相比,图像的数据增强是非常直观的,我们只需要查看图像就可以看到特定图像是如何转换的,并且使用肉眼就能对效果有一个初步的评判结果。 尽管增强在图像域中很常见,但在其他的领域中也是可以进行 阅读全文
posted @ 2022-03-24 10:49 deephub 阅读(174) 评论(0) 推荐(0)
摘要: 为梯度提升学习选择默认的特征编码策略需要考虑的两个重要因素是训练时间和与特征表示相关的预测性能。Automunge库是处理表格数据常用的库,它可以填充空值,也可以进行分类的编码和归一化等操作,默认的境况下Automunge对分类特征进行二值化处理,并对数值特征进行z-score归一化。本文将通过对一 阅读全文
posted @ 2022-03-23 11:33 deephub 阅读(135) 评论(0) 推荐(0)
摘要: 这篇文章将会详细介绍格拉姆角场 (Gramian Angular Field),并通过代码示例展示“如何将时间序列数据转换为图像”。 Gramian Angular Summation / Difference Fields (GASF / GADF)可以将时间序列转换成图像,这样我们就可以将卷积神 阅读全文
posted @ 2022-03-22 10:25 deephub 阅读(1554) 评论(0) 推荐(0)
摘要: 在机器学习中,如果我们的样本数量很大,在大多数情况下,首选解决方案是减少样本量、更改算法,或者通过添加更多内存来升级机器。这些方案不仅粗暴,而且可能并不总是可行的。由于大多数机器学习算法都期望数据集(例如常用的 DataFrame)是保存在内存中的对象(因为内存读取要比磁盘读取快不止一个量级),所以 阅读全文
posted @ 2022-03-21 10:56 deephub 阅读(419) 评论(0) 推荐(0)
摘要: 孤立森林是 一种无监督算法的异常检测,可以快速检测数据集中的异常值。 孤立森林是一种简单但非常有效的算法,能够非常快速地发现数据集中的异常值。理解这个算法对于处理表格数据的数据科学家来说是必须的,所以在本文中将简要介绍算法背后的理论及其实现。 由于其算法非常的简单并且高效,所以 Scitkit Le 阅读全文
posted @ 2022-03-20 11:53 deephub 阅读(173) 评论(0) 推荐(0)
摘要: 对于NLP 爱好者来说HuggingFace肯定不会陌生,因为现在几乎一提到NLP就会有HuggingFace的名字出现,HuggingFace为NLP任务提供了维护了一系列开源库的应用和实现,虽然效率不是最高的,但是它为我们入门和学习提供了非常好的帮助,今天我们来看一下用于NLP任务的数据集总结。 阅读全文
posted @ 2022-03-19 11:10 deephub 阅读(525) 评论(0) 推荐(0)
摘要: 部分依赖图 (PDP) 和个体条件期望 (ICE) 图可用于可视化和分析训练目标与一组输入特征之间的交互关系。 部分依赖图(Partial Dependence Plot) 部分依赖图显示了目标函数(即我们的机器学习模型)和一组特征之间的依赖关系,并边缘化其他特征的值(也就是补充特征)。它们是通过将 阅读全文
posted @ 2022-03-18 10:00 deephub 阅读(769) 评论(0) 推荐(0)
摘要: 本篇文章将对自监督学习的要点进行总结,包括以下几个方面: 监督学习与自监督学习 自监督学习需求背后的动机 NLP 和CV中的自监督学习 联合嵌入架构 对比学习 关于数据增强的有趣观察 非对比学习 总结和参考 监督学习与自监督学习 监督学习:机器学习中最常见的方法是监督学习。在监督学习中,我们得到一组 阅读全文
posted @ 2022-03-17 11:00 deephub 阅读(488) 评论(0) 推荐(0)
摘要: 说到计算机生成的图像肯定就会想到deep fake:将马变成的斑马或者生成一个不存在的猫。在图像生成方面GAN似乎成为了主流,但是尽管这些模型在生成逼真的图像方面取得了巨大成功,但他们的缺陷也是十分明显的,而且并不是生成图像的全部。自编码器(autoencoder)作为生成的图像的传统模型还没有过时 阅读全文
posted @ 2022-03-16 11:16 deephub 阅读(359) 评论(0) 推荐(0)
上一页 1 ··· 138 139 140 141 142 143 144 145 146 ··· 155 下一页