读取、创建和运行多个文件的3个Python技巧

作者|Khuyen Tran 编译|VK 来源|Towards Data Science 动机 将代码投入生产时,你很可能需要处理代码文件的组织。读取、创建和运行许多数据文件非常耗时。本文将向你展示如何自动 循环访问目录中的文件 如果不存在嵌套文件,创建它们 使用bash for loop运行一个具 ...

词嵌入教程

作者|Shraddha Anala 编译|VK 来源|Towards Data Science 无论我们是谁,阅读、理解、交流并最终产生新的内容是我们在职业生活中都要做的事情。 当涉及到从给定的文本体中提取有用的特征时,所涉及的过程与连续整数向量(词袋)相比是根本不同的。这是因为句子或文本中的信息是 ...

用Python构建和可视化决策树

作者|Nikhil Adithyan 编译|VK 来源|Towards Data Science 决策树 决策树是当今最强大的监督学习方法的组成部分。决策树基本上是一个二叉树的流程图,其中每个节点根据某个特征变量将一组观测值拆分。 决策树的目标是将数据分成多个组,这样一个组中的每个元素都属于同一个类 ...

基于深度学习的推荐系统

作者|James Loy 编译|VK 来源|Towards Data Science 传统的推荐系统基于聚类、最近邻和矩阵分解等方法。然而,近年来,深度学习在从图像识别到自然语言处理等多个领域取得了巨大的成功。推荐系统也得益于深度学习的成功。事实上,如今最先进的推荐系统,比如Youtube和Amaz ...

如何对Pandas DataFrame进行自定义排序

作者|B. Chen 编译|VK 来源|Towards Data Science Pandas DataFrame有一个内置方法sort_values(),可以根据给定的变量对值进行排序。该方法本身使用起来相当简单,但是它不适用于自定义排序,例如, t恤尺寸:XS、S、M、L和XL 月份:一月、二月 ...

通过深层神经网络生成音乐

作者|Ramya Vidiyala 编译|VK 来源|Towards Data Science 深度学习改善了我们生活的许多方面,无论是明显的还是微妙的。深度学习在电影推荐系统、垃圾邮件检测和计算机视觉等过程中起着关键作用。 尽管围绕深度学习作为黑匣子和训练难度的讨论仍在进行,但在医学、虚拟助理和电 ...

车的换道检测

作者|Hitesh Valecha 编译|VK 来源|Towards Data Science 在本教程中,我们将学习如何使用计算机视觉和图像处理来检测汽车是否在路上变道。 你一定听说过使用Opencv haar cascade可以检测人脸、眼睛或汽车、公共汽车等物体?这次让我们用这个简单的检测方法 ...

神经网络简史

作者|SANYA4 编译|VK 来源|Analytics Vidhya 介绍 现在神经网络无处不在。各大公司都在硬件和人才上大肆挥霍,以确保他们能够构建最复杂的神经网络,并推出最好的深度学习解决方案。 虽然深度学习是机器学习的一个相当古老的子集,但直到20世纪10年代初,它才得到应有的认可。今天,它 ...

使用NLP和ML来提取和构造Web数据

作者|Conner Brew 编译|VK 来源|Towards Data Science 介绍 在本文中,我们将创建一个基于战争研究所(ISW)的结构化文档数据库。ISW为外交和情报专业人员提供信息产品,以加深对世界各地发生的冲突的了解。 要查看与本文相关联的原始代码和Notebook,请访问以下链 ...

电子邮件分类的最佳机器学习算法

作者|Mahnoor Javed 编译|VK 来源|Towards Data Science 电子邮件分类是一个机器学习问题,属于监督学习范畴。 这个电子邮件分类的小项目的灵感来自J.K.Rowling以笔名出版的一本书。Udacity的“机器学习简介”提供了算法和项目的全面研究:https://w ...

一个二分类下没有免费午餐定理的题

一个证明题 周志华《机器学习》第一章中,有一个关于“没有免费的午餐”定理的题目,题目是这样的: 假设样本空间$\mathcal\(和假设空间\)\mathcal$都是离散的,令$P(h|X,\mathcal_a)\(为算法\)\mathcal_a$基于训练数据$X$产生假设$h$的概率,令$f$代表 ...

端到端机器学习项目:评论分类

作者|Kiprono Elijah Koech 编译|VK 来源|Towards Data Science 在本文中,我们将讨论一个分类问题,该问题涉及到将评论分为正面或负面。这里使用的评论是客户在ABC服务上所做的评论。 数据收集和预处理 在这个项目中使用的数据是从网上爬来的,数据清理在这个Not ...

24个提高你的知识和技能极限的数据科学(机器学习)项目(免费)

作者|ANALYTICS VIDHYA 编译|Flin 来源|analyticsvidhya 介绍 数据科学(机器学习)项目为你提供了一种有前途的方式来启动你在该领域的职业。你不仅可以通过应用它来学习数据科学,还可以在自己的简历上展示一些项目! 如今,招聘人员通过他/她的工作来评估应聘者的潜力,而不 ...

5个优秀的计算机视觉应用与相关数据集

作者|SHIPRA SAXENA 编译|Flin 来源|analyticsvidhya 总览 计算机视觉是一种允许数字世界与现实世界互动的技术。 探索5个最热门的计算机视觉应用程序 使用计算机视觉进行姿态估计 使用Gans进行图像转换 开发社交距离工具的计算机视觉 将2D图像转换为3D模型 医学图像 ...

<1···678···39>