作者|Khuyen Tran 编译|VK 来源|Towards Data Science 动机 将代码投入生产时,你很可能需要处理代码文件的组织。读取、创建和运行许多数据文件非常耗时。本文将向你展示如何自动 循环访问目录中的文件 如果不存在嵌套文件,创建它们 使用bash for loop运行一个具 ...
作者|Shraddha Anala 编译|VK 来源|Towards Data Science 无论我们是谁,阅读、理解、交流并最终产生新的内容是我们在职业生活中都要做的事情。 当涉及到从给定的文本体中提取有用的特征时,所涉及的过程与连续整数向量(词袋)相比是根本不同的。这是因为句子或文本中的信息是 ...
作者|Nikhil Adithyan 编译|VK 来源|Towards Data Science 决策树 决策树是当今最强大的监督学习方法的组成部分。决策树基本上是一个二叉树的流程图,其中每个节点根据某个特征变量将一组观测值拆分。 决策树的目标是将数据分成多个组,这样一个组中的每个元素都属于同一个类 ...
作者|James Loy 编译|VK 来源|Towards Data Science 传统的推荐系统基于聚类、最近邻和矩阵分解等方法。然而,近年来,深度学习在从图像识别到自然语言处理等多个领域取得了巨大的成功。推荐系统也得益于深度学习的成功。事实上,如今最先进的推荐系统,比如Youtube和Amaz ...
作者|B. Chen 编译|VK 来源|Towards Data Science Pandas DataFrame有一个内置方法sort_values(),可以根据给定的变量对值进行排序。该方法本身使用起来相当简单,但是它不适用于自定义排序,例如, t恤尺寸:XS、S、M、L和XL 月份:一月、二月 ...
作者|Ramya Vidiyala 编译|VK 来源|Towards Data Science 深度学习改善了我们生活的许多方面,无论是明显的还是微妙的。深度学习在电影推荐系统、垃圾邮件检测和计算机视觉等过程中起着关键作用。 尽管围绕深度学习作为黑匣子和训练难度的讨论仍在进行,但在医学、虚拟助理和电 ...
作者|Hitesh Valecha 编译|VK 来源|Towards Data Science 在本教程中,我们将学习如何使用计算机视觉和图像处理来检测汽车是否在路上变道。 你一定听说过使用Opencv haar cascade可以检测人脸、眼睛或汽车、公共汽车等物体?这次让我们用这个简单的检测方法 ...
作者|SANYA4 编译|VK 来源|Analytics Vidhya 介绍 现在神经网络无处不在。各大公司都在硬件和人才上大肆挥霍,以确保他们能够构建最复杂的神经网络,并推出最好的深度学习解决方案。 虽然深度学习是机器学习的一个相当古老的子集,但直到20世纪10年代初,它才得到应有的认可。今天,它 ...
作者|Conner Brew 编译|VK 来源|Towards Data Science 介绍 在本文中,我们将创建一个基于战争研究所(ISW)的结构化文档数据库。ISW为外交和情报专业人员提供信息产品,以加深对世界各地发生的冲突的了解。 要查看与本文相关联的原始代码和Notebook,请访问以下链 ...
作者|Mahnoor Javed 编译|VK 来源|Towards Data Science 电子邮件分类是一个机器学习问题,属于监督学习范畴。 这个电子邮件分类的小项目的灵感来自J.K.Rowling以笔名出版的一本书。Udacity的“机器学习简介”提供了算法和项目的全面研究:https://w ...
GINet:Graph Interaction Network for Scene Parsing 论文地址:https://arxiv.org/pdf/2009.06160.pdf 一、背景 Scene Parsing 任务属于语义分割的一个分支,也是把每个像素点分成一个具体的语义类别,它和常见的 ...
一个证明题 周志华《机器学习》第一章中,有一个关于“没有免费的午餐”定理的题目,题目是这样的: 假设样本空间$\mathcal\(和假设空间\)\mathcal$都是离散的,令$P(h|X,\mathcal_a)\(为算法\)\mathcal_a$基于训练数据$X$产生假设$h$的概率,令$f$代表 ...
作者|Ram Sagar 编译|VK 来源|Analytics In Diamag “库开发人员不再需要在框架之间进行选择。” 来自德国图宾根人工智能中心的研究人员介绍了一种新的Python框架EagerPy,EagerPy允许开发人员编写独立于PyTorch和TensorFlow等流行框架的代码。 ...
作者|Kiprono Elijah Koech 编译|VK 来源|Towards Data Science 在本文中,我们将讨论一个分类问题,该问题涉及到将评论分为正面或负面。这里使用的评论是客户在ABC服务上所做的评论。 数据收集和预处理 在这个项目中使用的数据是从网上爬来的,数据清理在这个Not ...
作者|ANALYTICS VIDHYA 编译|Flin 来源|analyticsvidhya 介绍 数据科学(机器学习)项目为你提供了一种有前途的方式来启动你在该领域的职业。你不仅可以通过应用它来学习数据科学,还可以在自己的简历上展示一些项目! 如今,招聘人员通过他/她的工作来评估应聘者的潜力,而不 ...
宽度学习系统(Broad Learning System, BLS) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 宽度学习系统(Broad Learning System, BLS)由Chen等[1]提出,其基于“平展型”神经网络,因其高效性、结构 ...
作者|SHIPRA SAXENA 编译|Flin 来源|analyticsvidhya 总览 计算机视觉是一种允许数字世界与现实世界互动的技术。 探索5个最热门的计算机视觉应用程序 使用计算机视觉进行姿态估计 使用Gans进行图像转换 开发社交距离工具的计算机视觉 将2D图像转换为3D模型 医学图像 ...
参考以及部分转载: [1] 牧野之歌, 相似度算法之余弦相似度, CSDN, https://blog.csdn.net/zz_dd_yy/article/details/51926305. [2] 京东云成都, 余弦相似度度量,CSDN,https://blog.csdn.net/u0121606 ...
作者|Renu Khandelwal 编译|VK 来源|Towards Data Science 在本文中,你将学习如何加载自定义数据和创建图像序列和测试数据集,作为深度学习模型的输入。 Open CV2 PIL 这里使用的数据集是来自Kaggle的Intel图像分类。 数据集链接:https:// ...
作者|Michael Chau 编译|VK 来源|Towards Data Science 大家都知道Scikit-Learn——它是数据科学家基本都知道的产品,提供了几十种易于使用的机器学习算法。它还提供了两种现成的技术来解决超参数调整问题:网格搜索(GridSearchCV)和随机搜索(Rand ...