视觉测试工具箱

作者|Martin Schneider 编译|Flin 来源|medium 视觉回归测试最常见的情况是使用基线图像进行测试。然而,视觉测试的不同方面也值得讨论。我们将介绍模板匹配(使用OpenCV)、布局测试(使用Galen)和OCR(使用Tesseract),并展示如何将这些工具无缝集成到现有的A ...

使用树莓派制作智能小车

电影里,时不时地可以看到一些这样的场景,一辆小车,上面装有摄像头,这辆小车可以通过电脑或都是手机进行远程遥控,车上摄像头拍到的画面,可以实时地显示在电脑或手机上,就像下图这样。 没有接触过这方面的朋友或许会觉得这是一门很高大上的技术活,其实,并不然,这种小车做起来其实很简单。那么,这样子的小车,需要 ...

网络安全中的机器学习——恶意软件安装

作者|Elaine Hung 编译|Flin 来源|analyticsvidhya 介绍 监视本地管理员执行的用户活动始终是SOC分析人员和安全专业人员面临的挑战。大多数安全框架都会建议实施白名单机制。 但是,现实世界通常并不理想。始终有不同的开发人员或用户拥有本地管理员权限来绕过指定的控件。有没有 ...

用Numpy,Open-CV增强灰度图像

作者|Kavya Musty 编译|Flin 来源|medium 我们经常扫描纸张把它们转换成图像。我们有各种各样的工具可以在线增强这些图像,使它们的亮度更亮,并消除这些图像中的阴影。如果我们可以手动去除阴影呢?我们可以将任何图像作为灰度图像加载到我们的代码中,并在几秒钟内获得输出,而无需任何应用程 ...

基于Docker的Python开发

作者|GUEST 编译|VK 来源|Analytics Vidhya 在PyCharm和Visual Studio代码上支持CUDA 介绍 如果你没有经验,建立一个开发环境是不容易的,特别是如果你想学习的技术很多。 本教程旨在向你展示如何在PyCharm或Visual Studio代码中设置一个基于 ...

基于K近邻的电影推荐与分级预测

作者|GUEST 编译|VK 来源|Analytics Vidhya 介绍 在当今繁忙的世界中,推荐系统变得越来越重要。人们总是在寻找最适合他们的产品/服务。因此,推荐系统非常重要,因为它们可以帮助用户在不消耗认知资源的情况下做出正确的选择。 在本博客中,我们将了解推荐系统的基础知识,并学习如何通过 ...

python面向对象编程的基本概念

作者|HIMANSHI SINGH 编译|VK 来源|Analytics Vidhya 介绍 在学习面向对象编程时,我决定深入研究它的历史,结果发现它很迷人。术语“面向对象编程”(OOP)是Alan Kay 在1966年研究生院时提出的。 Simula语言是第一种具有面向对象编程特点的编程语言。它是 ...

python面向对象编程的基本概念

作者|HIMANSHI SINGH 编译|VK 来源|Analytics Vidhya 介绍 在学习面向对象编程时,我决定深入研究它的历史,结果发现它很迷人。术语“面向对象编程”(OOP)是Alan Kay 在1966年研究生院时提出的。 Simula语言是第一种具有面向对象编程特点的编程语言。它是 ...

《黑客:计算机革命的英雄》读后感

这个国庆长假读了几本好书,但时隔几天还能写得出一点心得的只有这本《黑客:计算机革命的英雄》,电子书应该买了几年了,一直没有仔细看,或者说更重要的问题是没有好的角度去看,这次看的时候Get到了AI这个关键字,终于看进去了。 这本书讲的是黑客文化与伦理,但看了这本书以后,再将一些事件联系起来,我对于信息 ...

Pandas的数据过滤

作者|Amanda Iglesias Moreno 编译|VK 来源|Towards Datas Science 从数据帧中过滤数据是清理数据时最常见的操作之一。Pandas提供了一系列根据行和列的位置和标签选择数据的方法。此外,Pandas还允许你根据列类型获取数据子集,并使用布尔索引筛选行。 在 ...

路透社文章的文本数据分析与可视化

作者|Manmohan Singh 编译|VK 来源|Towards Datas Science 当我要求你解释文本数据时,你会怎么做?你将采取什么步骤来构建文本可视化? 本文将帮助你获得构建可视化和解释文本数据所需的信息。 从文本数据中获得的见解将有助于我们发现文章之间的联系。它将检测趋势和模式。 ...

数据挖掘 - 用户问答精准邀请挖掘

Data Mining Project Report Notebook 代码预览 摘要 每天都有数以十万计的新问题以及 UGC 内容产生在知乎网站,如何高效的将这些用户新提出的问题邀请其他用户进行解答,以及挖掘用户有能力且感兴趣的问题进行邀请下发,优化邀请回答的准确率,提高问题解答率以及回答生产数, ...

利用深度学习进行时间序列预测

作者|Christophe Pere 编译|VK 来源|Towards Datas Science 介绍 长期以来,我听说时间序列问题只能用统计方法(AR[1],AM[2],ARMA[3],ARIMA[4])。这些技术通常被数学家使用,他们试图不断改进这些技术来约束平稳和非平稳的时间序列。 几个月前 ...

使用Pandas DataFrame输出报告

作者|Christopher Tao 编译|VK 来源|Towards Datas Science 作为一个使用Python作为主要编程语言的数据科学家或分析师,我相信你一定经常使用Pandas。在Jupyter Notebook上输出pandas DataFrame是非常频繁的。 然而,你有没有想 ...

向量化代码

作者|Andy Reagan 编译|VK 来源|Towards Datas Science 在MATLAB和数值计算的世界,for循环被剪掉,而向量为王。 在我的博士学位期间,Lakoba教授的数值分析课是我参加的最具挑战性的课程之一,在课程之后,我对向量代码有了深刻的理解。 我最喜欢的向量化例子是 ...

使用列表、字典和集合生成式来缩短代码

作者|Philip Wilkinson 编译|VK 来源|Towards Datas Science 在使用Python将近一年的时间里,我经常遇到“生成式”这个词,但我没生成式它的确切含义或它所涵盖的内容。 直到最近,我才发现,有了生成式后,我可以利用列表将我的代码从多行缩短为一行。此外,这种代码 ...

Pandas transform函数

作者|B. Chen 编译|VK 来源|Towards Datas Science Pandas是一个惊人的库,它包含了大量用于操作数据的内置函数。其中,transform()在处理行或列时非常有用。 在本文中,我们将介绍以下最常用的Pandas transform()用途: 转换值 组合group ...

用Keras构建神经网络的3种方法

作者|Orhan Gazi Yalçın 编译|VK 来源|Towards Datas Science 如果你看看不同的教程,搜索,花大量时间研究关于TensorFlow的Stack Overflow,你可能已经意识到有很多不同的方法来构建神经网络模型。 这一直是TensorFlow面临的问题。这就 ...

超参数贝叶斯优化

超参数(Hyper-parameter)是定义模型或者定义训练过程的参数,是相对于模型参数(Parameter)来说的,比如目标检测网络的网络结构,激活函数的选择,学习率的大小,Anchor的尺寸等等,都属于超参数.超参数对网络的性能(如目标检测网络的mAP等)有很大的影响,因此需要找到性能最优的参 ...

<1···789···40>