TF2目标检测API

作者|Ivan Ralašić 编译|VK 来源|Analytics Vidhya Tensorflow目标检测API(TF OD API)刚刚变得更好。最近,Google发布了tf od api的新版本,它现在支持Tensorflow 2.x,这是一个我们一直在等待的巨大改进! 简介 最近目标检测 ...

【读】Federated Machine Learning: Concept and Applications

{% note info %} 论文线上阅读 {% endnote %} Questions heuristic fundamental 数据少,指的是样本少;数据的质量低,我觉得并不是数据不可信,而是数据的特征空间小,包含的信息少,建模后并不能得到有效的结论。早期有一种观点是直接在这种数据少且质量 ...

未探索的TensorFlow库

作者|Vardan Agarwal 编译|VK 来源|Towards Datas Science TensorFlow是一个端到端的开源机器学习平台,能够执行一系列任务。它为初学者和研究人员提供了一个易用性,可以用于不同的应用,如,但不限于,计算机视觉,自然语言处理和强化学习。 在计算机视觉领域,我 ...

Spark—15分钟教程

作者|Andrea Ialenti 编译|VK 来源|Towards Datas Science 正如在我几乎所有关于这个工具的文章中都写到,Spark和SQL一样非常容易使用。但不管我花多少时间写代码,我只是无法在我的大脑中永久性地存储Spark API(有人会说我的记忆就像RAM一样,小而易失) ...

掌握Pandas时间序列分析的20个知识点

作者|Soner Yıldırım 编译|VK 来源|Towards Datas Science 时间序列数据有很多种定义,它们以不同的方式表示相同的含义。一个简单的定义是,时间序列数据是包含序列时间戳的数据点。 时间序列数据的来源是周期性测量或观测。我们观察了许多行业的时间序列数据。举几个例子: ...

Scikit入门指南

作者|Rebecca Vickery 编译|VK 来源|Towards Datas Science scikit-learn是2007年作为Googles Summer代码项目开发的,现在被广泛认为是最流行的机器学习Python库。 为什么这个库被认为是机器学习项目的最佳选择之一,特别是在生产系统中 ...

Databricks入门:分析COVID-19

作者|Renan Ferreira 编译|VK 来源|Towards Datas Science 典型的数据科学工作流由以下步骤组成: 确定业务需求->数据获取->数据准备->数据分析->共享数据见解 每一个步骤都需要一套专业知识,这些专业知识可分为: 数据工程师:开发、构建、测试和维护数据管道 数 ...

数据科学家的Pytest

作者|Khuyen Tran 编译|VK 来源|Towards Datas Science 动机 应用不同的python代码来处理notebook中的数据是很有趣的,但是为了使代码具有可复制性,你需要将它们放入函数和类中。将代码放入脚本时,代码可能会因某些函数而中断。那么,如何检查你的功能是否如你所 ...

Pipeline, ColumnTransformer和FeatureUnion

作者|Zolzaya Luvsandorj 编译|VK 来源|Towards Datas Science 掌握sklearn必须知道这三个强大的工具。因此,在建立机器学习模型时,学习如何有效地使用这些方法是至关重要的。 在深入讨论之前,我们先从两个方面着手: Transformer:Transfor ...

用Seaborn绘制图表

作者|Jenny Dcruz 编译|VK 来源|Towards Datas Science Seaborn是一个功能强大的Python库,用于增强数据可视化。它为Matplotlib提供了大量高级接口。Seaborn可以很好地处理数据帧,而Matplotlib则不行,它可以让你以更简单的方式绘制引人 ...

Matplotlib vs ggplot2

作者|Dario Radečić 编译|VK 来源|Towards Datas Science 2020年即将结束(终于),数据可视化再重要不过了。呈现一个看起来像5岁小孩的东西已经不再是一个选择,所以数据科学家需要一个有吸引力和简单易用的数据可视化库。 今天我们将比较其中的两个-Matplotli ...

统计学习方法第二版第一章统计学及监督学习概论笔记

#1. 统计学习 ##1.1 统计学习的方法 基于数据构建概率统计模型从而对数据进行预测与分析。统计学习由监督学习、无监督学习、强化学习等组成 ##1.2 实现统计学习的方法的步骤 1)得到一个有限的训练数据集合 2)确定包含所有可能的模型的假设空间,即学习模型的集合 3)确定模型选择的准则,即学习 ...

NVIDIA Jetson TX2刷机

下载 SDK Managerhttps://developer.nvidia.com/nvidia-sdk-manager-archive在虚拟机中安装运行sdkmanager$ sdkmanager磁盘空间要满足要求,安装的时候需要很大的空间,磁盘空间不足会导致安装失败屏幕分辨率要满足要求,安装页... ...

蒙特卡罗计算积分

作者|Cory Maklin 编译|VK 来源|Towards Datas Science 通常情况下,我们不能解析地求解积分,必须借助其他方法,其中就包括蒙特卡罗积分。你可能还记得,函数的积分可以解释为函数曲线下的面积。 蒙特卡罗积分的工作原理是在a和b之间的不同随机点计算一个函数,将矩形的面积相 ...

使用Matplotlib可视化数据的5个强大技巧

作者|Rizky Maulana Nurhidayat 编译|VK 来源|Towards Datas Science 数据可视化用于以更直接的表示方式显示数据,并且更易于理解。它可以用柱状图、散点图、折线图、饼图等形式形成。许多人仍然使用Matplotlib作为后端模块来可视化他们的图形。在这个故事 ...

情感分析教程

作者|Zijing Zhu 编译|VK 来源|Towards Datas Science 据估计,世界上80%的数据是非结构化的。因此,从非结构化数据中提取信息是数据分析的重要组成部分。 文本挖掘是从非结构化文本数据中获取有价值的信息的过程,情感分析是文本挖掘的应用之一。它使用自然语言处理和机器学习 ...

<1···8910···39>