无所不能的Embedding1 - Word2vec模型详解&代码实现

word2vec是google 2013年提出的,从大规模语料中训练词向量的模型,在许多场景中都有应用,信息提取相似度计算等等。也是从word2vec开始,embedding在各个领域的应用开始流行,所以拿word2vec来作为开篇再合适不过了。本文希望可以较全面的给出Word2vec从模型结构概述... ...

python 调用百度接口 做人脸识别

操作步骤差不多,记得要在百度AIPI中的控制台中创建对应的工单 创建工单成功后 会生成两个key 这个两个key是要生成tokn 用 这里大家可以用 def函数 将token返回 供下面的接口使用 import requestshost='https://aip.baidubce.com/oauth ...

使用TPU在PyTorch中实现ResNet50

作者|DR. VAIBHAV KUMAR 编译|VK 来源|Analytics In Diamag PyTorch通过提供大量强大的工具和技术,一直在推动计算机视觉和深度学习领域的发展。 在计算机视觉领域,基于深度学习的执行需要处理大量的图像数据集,因此需要一个加速的环境来加快执行过程以达到可接受的 ...

卷积神经网络 part1

【任务一】视频学习心得及问题总结 根据下面三个视频的学习内容,写一个总结,最后列出没有学明白的问题。 【任务二】代码练习 在谷歌 Colab 上完成代码练习,关键步骤截图,并附一些自己的想法和解读。 【任务三】展望学习 结合论文自学谷歌提出的 Inception V1 至 V4, 以及 Mobile ...

何时使用约束求解而不是机器学习

作者|Antoine Champion 编译|VK 来源|Towards Data Science 机器学习和深度学习一直是业界的热门话题。品牌领先于功能,导致深度学习在许多人工智能应用中被过度使用。 这篇文章将提供对约束求解的快速理解,这是一个强大但未被充分利用的方法,可以解决人工智能和其他计算机 ...

用Python构建数据科学Web应用程序

作者|Chanin Nantasenamat 编译|VK 来源|Towards Data Science 在本文中,我将向你展示如何使用streamlit python库快速构建一个简单的数据驱动web应用程序,只需几行代码。 作为一名数据科学家或机器学习工程师,能够部署我们的数据科学项目是很重要的 ...

深度学习分类网络的发展历史

人工智能(AI)是目前IT最前沿的领域之一,而深度学习(Deep Learning)则是AI中最火热的方向。深度学习是指深度的神经网络,这主要是因为网络深了之后才可以表现更广阔的意思,而神经网络最基本的问题是分类问题。本文从神经网络开始起,讲讲深度学习分类网络的发展历史以及其中用到的技术。 ...

构建对象检测模型

作者|ALAKH SETHI 编译|VK 来源|Analytics Vidhya 目标检测 我喜欢深度学习。坦率地说,这是一个有大量技术和框架可供倾注和学习的广阔领域。当我看到现实世界中的应用程序,如面部识别和板球跟踪等时,建立深度学习和计算机视觉模型的真正兴奋就来了。 我最喜欢的计算机视觉和深入学 ...

PyTorch实现TPU版本CNN模型

作者|DR. VAIBHAV KUMAR 编译|VK 来源|Analytics In Diamag 随着深度学习模型在各种应用中的成功实施,现在是时候获得不仅准确而且速度更快的结果。 为了得到更准确的结果,数据的大小是非常重要的,但是当这个大小影响到机器学习模型的训练时间时,这一直是一个值得关注的问 ...

C++机器学习库介绍

作者|ALAKH SETHI 编译|VK 来源|Analytics Vidhya 介绍 我喜欢使用C++。C++是我学习过的第一种编程语言,我喜欢在机器学习中使用它。 我在之前写过关于构建机器学习模型的文章。我收到了一个回复,问我C++有没有机器学习的库? 这是个公平的问题。像Python和R这样的 ...

假设检验:使用p值来接受或拒绝你的假设

作者|GUEST 编译|VK 来源|Analytics Vidhya 介绍 检验是统计学中最基本的概念之一。不仅在数据科学中,假设检验在各个领域都很重要。想知道怎么做?让我们举个例子。现在有一个lifebuoy沐浴露。 沐浴露厂商声称,它杀死99.9%的细菌。他们怎么能这么说呢?必须有一种测试技术来 ...

使用python脚本统一重命名训练图片文件名

Yolo算法,在进行模型训练时,常常使用VOC数据格式。 将图片文件复制到JPEGImages目录下,需要对文件名进行VOC标准格式编号重命名,如2020_000001.jpg,2020_000002.jpg,这样便于voc_label.py来进行后续处理。 这个工作如果手工作业,是个体力活。因此使 ...

生成流畅文本方法

作者|Aaron Abrahamson 编译|VK 来源|Towards Data Science 在沙丘魔堡2000上训练文本生成模型 沙丘魔堡是一个遥远的封建社会的故事。它关注的是一位公爵和他的家人,他们被迫成为沙漠星球阿拉基斯的管理者。弗兰克·赫伯特在1965年出版了这部经典作品。几乎任何现代 ...

KNNImputer:一种可靠的缺失值插补方法

作者|KAUSHIK 编译|VK 来源|Analytics Vidhya 概述 学会用KNNImputer来填补数据中的缺失值 了解缺失值及其类型 介绍 scikit learn公司的KNNImputer是一种广泛使用的缺失值插补方法。它被广泛认为是传统插补技术的替代品。 在当今世界,数据是从许多来 ...

SparseNN中的优化

作者|The AI LAB 编译|VK 来源|Medium 对SparseNN模型的过拟合进行研究,并探索了多种正则化方法,如嵌入向量的max-norm/constant-norm、稀疏特征id的dropout、参数的freezing、嵌入收缩等。然而,据我们所知,在单次训练中,没有显著的减少过拟合 ...

基于TorchText的PyTorch文本分类

作者|DR. VAIBHAV KUMAR 编译|VK 来源|Analytics In Diamag 文本分类是自然语言处理的重要应用之一。在机器学习中有多种方法可以对文本进行分类。但是这些分类技术大多需要大量的预处理和大量的计算资源。在这篇文章中,我们使用PyTorch来进行多类文本分类,因为它有如 ...

蒙特卡洛方法分析Web页面浏览量

作者|Michael Grogan 编译|VK 来源|Towards Data Science 蒙特卡洛这种方法在金融等领域得到了广泛的应用,以便对各种风险情景进行建模。 然而,该方法在时间序列分析的其他方面也有重要的应用。在这个特定的例子中,让我们看看蒙特卡洛方法如何被用来为web页面浏览量建模。 ...

<1···111213···39>