作者|GUEST 编译|VK 来源|Analytics Vidhya 介绍 SimCLR论文(http://cse.iitkgp.ac.in/~arastogi/papers/simclr.pdf)解释了这个框架如何从更大的模型和更大的批处理中获益,并且如果有足够的计算能力,可以产生与监督模型类似的 ...
作者|Ivan Ralašić 编译|VK 来源|Analytics Vidhya Tensorflow目标检测API(TF OD API)刚刚变得更好。最近,Google发布了tf od api的新版本,它现在支持Tensorflow 2.x,这是一个我们一直在等待的巨大改进! 简介 最近目标检测 ...
{% note info %} 论文线上阅读 {% endnote %} Questions heuristic fundamental 数据少,指的是样本少;数据的质量低,我觉得并不是数据不可信,而是数据的特征空间小,包含的信息少,建模后并不能得到有效的结论。早期有一种观点是直接在这种数据少且质量 ...
作者|Vardan Agarwal 编译|VK 来源|Towards Datas Science TensorFlow是一个端到端的开源机器学习平台,能够执行一系列任务。它为初学者和研究人员提供了一个易用性,可以用于不同的应用,如,但不限于,计算机视觉,自然语言处理和强化学习。 在计算机视觉领域,我 ...
作者|Andrea Ialenti 编译|VK 来源|Towards Datas Science 正如在我几乎所有关于这个工具的文章中都写到,Spark和SQL一样非常容易使用。但不管我花多少时间写代码,我只是无法在我的大脑中永久性地存储Spark API(有人会说我的记忆就像RAM一样,小而易失) ...
作者|Soner Yıldırım 编译|VK 来源|Towards Datas Science 时间序列数据有很多种定义,它们以不同的方式表示相同的含义。一个简单的定义是,时间序列数据是包含序列时间戳的数据点。 时间序列数据的来源是周期性测量或观测。我们观察了许多行业的时间序列数据。举几个例子: ...
作者|Rebecca Vickery 编译|VK 来源|Towards Datas Science scikit-learn是2007年作为Googles Summer代码项目开发的,现在被广泛认为是最流行的机器学习Python库。 为什么这个库被认为是机器学习项目的最佳选择之一,特别是在生产系统中 ...
作者|Renan Ferreira 编译|VK 来源|Towards Datas Science 典型的数据科学工作流由以下步骤组成: 确定业务需求->数据获取->数据准备->数据分析->共享数据见解 每一个步骤都需要一套专业知识,这些专业知识可分为: 数据工程师:开发、构建、测试和维护数据管道 数 ...
作者|Bex Tuychiev 编译|VK 来源|Towards Datas Science 介绍 本文的目标是让你对使用Seaborn的relplot()函数绘制统计图有一定的了解。 当我开始学习数据可视化时,我第一次被介绍到Matplotlib。它是一个如此巨大的库,你几乎可以看到任何与数据相关 ...
作者|Khuyen Tran 编译|VK 来源|Towards Datas Science 动机 应用不同的python代码来处理notebook中的数据是很有趣的,但是为了使代码具有可复制性,你需要将它们放入函数和类中。将代码放入脚本时,代码可能会因某些函数而中断。那么,如何检查你的功能是否如你所 ...
作者|Zolzaya Luvsandorj 编译|VK 来源|Towards Datas Science 掌握sklearn必须知道这三个强大的工具。因此,在建立机器学习模型时,学习如何有效地使用这些方法是至关重要的。 在深入讨论之前,我们先从两个方面着手: Transformer:Transfor ...
作者|Jenny Dcruz 编译|VK 来源|Towards Datas Science Seaborn是一个功能强大的Python库,用于增强数据可视化。它为Matplotlib提供了大量高级接口。Seaborn可以很好地处理数据帧,而Matplotlib则不行,它可以让你以更简单的方式绘制引人 ...
作者|Dario Radečić 编译|VK 来源|Towards Datas Science 2020年即将结束(终于),数据可视化再重要不过了。呈现一个看起来像5岁小孩的东西已经不再是一个选择,所以数据科学家需要一个有吸引力和简单易用的数据可视化库。 今天我们将比较其中的两个-Matplotli ...
#1. 统计学习 ##1.1 统计学习的方法 基于数据构建概率统计模型从而对数据进行预测与分析。统计学习由监督学习、无监督学习、强化学习等组成 ##1.2 实现统计学习的方法的步骤 1)得到一个有限的训练数据集合 2)确定包含所有可能的模型的假设空间,即学习模型的集合 3)确定模型选择的准则,即学习 ...
下载 SDK Managerhttps://developer.nvidia.com/nvidia-sdk-manager-archive在虚拟机中安装运行sdkmanager$ sdkmanager磁盘空间要满足要求,安装的时候需要很大的空间,磁盘空间不足会导致安装失败屏幕分辨率要满足要求,安装页... ...
作者|Cory Maklin 编译|VK 来源|Towards Datas Science 通常情况下,我们不能解析地求解积分,必须借助其他方法,其中就包括蒙特卡罗积分。你可能还记得,函数的积分可以解释为函数曲线下的面积。 蒙特卡罗积分的工作原理是在a和b之间的不同随机点计算一个函数,将矩形的面积相 ...
作者|Aniket Maurya 编译|VK 来源|Towards Datas Science 这个博客的源代码可以从https://github.com/aniketmaurya/tensorflow-web-app-starter-pack获得 让我们从一个简单的helloworld示例开始 首 ...
作者|Paul Hiemstra 编译|VK 来源|Towards Datas Science 你也可以在GitHub上阅读这篇文章。这个GitHub存储库包含你自己运行分析所需的一切:https://github.com/PaulHiemstra/lasso_tsfresh_article/blo ...
作者|Rizky Maulana Nurhidayat 编译|VK 来源|Towards Datas Science 数据可视化用于以更直接的表示方式显示数据,并且更易于理解。它可以用柱状图、散点图、折线图、饼图等形式形成。许多人仍然使用Matplotlib作为后端模块来可视化他们的图形。在这个故事 ...
作者|Zijing Zhu 编译|VK 来源|Towards Datas Science 据估计,世界上80%的数据是非结构化的。因此,从非结构化数据中提取信息是数据分析的重要组成部分。 文本挖掘是从非结构化文本数据中获取有价值的信息的过程,情感分析是文本挖掘的应用之一。它使用自然语言处理和机器学习 ...