0

机器学习中学习曲线的 bias vs variance 以及 数据量m

关于偏差、方差以及学习曲线为代表的诊断法: 在评估假设函数时,我们习惯将整个样本按照6:2:2的比例分割:60%训练集training set、20%交叉验证集cross validation set、20%测试集test set,分别用于拟合假设函数、模型选择和预测。 模型选择的方法为: 1. 使 ...

jingsupo 发布于 2018-10-28 13:56 评论(0)阅读(93)
0

机器学习之决策树(二)

一、复习信息熵 为了解决特征选择问题,找出最优特征,先要介绍一些信息论里面的概念。 1、熵(entropy) python3代码实现: 2、条件熵(conditional entropy) python3代码实现: 3、信息增益(information gain) python3代码实现: 看一个简 ...

时光top 发布于 2018-10-28 09:52 评论(0)阅读(94)
0

Halcon10 下载

Halcon10 下载地址:http://www.211xun.com/download_page_1.html HALCON 10 是一套机器视觉图像处理库,由一千多个算子以及底层的数据管理核心构成。其功能包含各类滤波,色彩以及几何,数学转换,形态学计算分析,校正,分类辨识,形状搜寻,手眼标定等等 ...

21ios 发布于 2018-10-27 11:05 评论(0)阅读(105)
0

Hadoop环境搭建及wordcount程序

目的: 前期学习了一些机器学习基本算法,实际企业应用中算法是核心,运行的环境和数据处理的平台是基础。 手段: 搭建简易hadoop集群(由于机器限制在自己的笔记本上通过虚拟机搭建) 一、基础环境介绍 win10 vmware15.0.0 3 ubuntu 虚拟机(1 台作为master ,另外2台作 ...

NeilZhang 发布于 2018-10-26 20:32 评论(0)阅读(189)
0

Apriori算法

hash tree(哈希树),是由tree和hash table结合,旨在优化hash table冲突解决方案的一种数据结构。 在链式hash table中,若关键字发生冲突,则创建单个新节点链到冲突节点之后,并把关键字插入到新节点。 而在hash tree结构中,若关键字发生冲突,则创建一组新节点 ...

kexinxin 发布于 2018-10-26 20:09 评论(0)阅读(45)
0

Faster RCNN论文解析

Faster R-CNN由一个推荐区域的全卷积网络和Fast R-CNN组成, Fast R-CNN使用推荐区域。整个网络的结构如下: 1.1 区域推荐网络 输入是一张图片(任意大小), 输出是目标推荐矩形框的集合,以及相应的目标打分。网络的前面使用了一个基本的卷积层集合来提取特征(ZF或VGG-1 ...

笨笨coding 发布于 2018-10-26 15:32 评论(0)阅读(1022)
0

特征工程之特征选择

特征工程是数据分析中最耗时间和精力的一部分工作,它不像算法和模型那样是确定的步骤,更多是工程上的经验和权衡。因此没有统一的方法。这里只是对一些常用的方法做一个总结。本文关注于特征选择部分。后面还有两篇会关注于特征表达和特征预处理。 1. 特征的来源 在做数据分析的时候,特征的来源一般有两块,一块是业 ...

jingsupo 发布于 2018-10-26 09:55 评论(0)阅读(45)
0

第一个线性回归程序(基于Jupyter)

import pandas as pdimport seaborn as snssns.set(context="notebook", style="whitegrid", palette="dark")import matplotlib.pyplot as pltimport tensorflow ...

python之路漫漫 发布于 2018-10-25 22:12 评论(0)阅读(302)
0

OpenPAI大规模人工智能平台安装部署文档

环境要求: 如果需要图形界面,需要在Ubuntu系统安装,否则centos系统安装时是没有问题的(web端和命令行进行任务提交) 安装过程需要有另外一台控制端机器(注意:区别于集群所在的任何一台服务器!!!),控制端和集群服务器确保ssh服务开通 集群中个节点的账户和密码确保一致 集群中每台服务器确 ...

牛角挂书 发布于 2018-10-25 17:20 评论(0)阅读(653)
0

利用人工智能(Magpie开源库)给一段中文的文本内容进行分类打标签

当下人工智能是真心的火热呀,各种原来传统的业务也都在尝试用人工智能技术来处理,以此来节省人工成本,提高生产效率。既然有这么火的利器,那么我们就先来简单认识下什么是人工智能吧,人工智能是指利用语音识别、语义理解、图像识别、视觉处理、机器学习、大数据分析等技术实现机器智能自动化做出响应的一种模拟人行为的... ...

麦荻(Miidy.com) 发布于 2018-10-24 16:54 评论(2)阅读(1991)
0

YoLo 实践(1)

目标: 使用Keras| tensorflow完成基于Yolo的车辆检测的训练; ...

修雨轩陈 发布于 2018-10-24 14:06 评论(0)阅读(852)
1

深度 | AI芯片终极之战

深度 | AI芯片终极之战 https://mp.weixin.qq.com/s?__biz=MzA4MTQ4NjQzMw==&mid=2652712307&idx=1&sn=28806ccb69a5f5d1142ac5f79ccde395&chksm=847dba7db30a336bfde664a ...

Terminator2050 发布于 2018-10-24 11:10 评论(0)阅读(61)
0

k-means算法之见解(一)

k-menas算法之见解 主要内容: 一、引言 二、k-means聚类算法 一、引言: 先说个K-means算法很高大上的用处,来开始新的算法学习。美国竞选总统,选票由公民投出,总统由大家决定。在2004年出现候选人得票数非常接近,所以1%的选民手中的选票非常关键,决定着总统的归属。那么如何找出这类 ...

时光top 发布于 2018-10-23 21:47 评论(0)阅读(37)
0

当语音识别搭配AI之后,我的语音助手更懂我的心了

欢迎大家前往 "腾讯云+社区" ,获取更多腾讯海量技术实践干货哦~ 本文由 "腾讯云AI中心" 发表于 "云+社区专栏" 我今天演讲主要分四个部分,第一个是分享语音识别概述,然后是深度神经网络的基础;接下来就是深度学习在语音识别声学模型上面的应用,最后要分享的是语音识别难点以及未来的发展方向。 首先 ...

腾讯云+社区 发布于 2018-10-23 17:33 评论(0)阅读(821)
0

阿里云深度学习采坑记

原因 打算研究下AI,以便不那么落后于这个时代,但是看了看,搞一个能支持AI算法的显卡就要天文数字。所以找到了阿里云的PAI平台,打算跑跑自己写的算法,采坑无数,搞了两天才搞定。 基本流程 阿里云提供了官方的教程:如果打算把自己的深度学习代码到阿里云PAI上运行的话,照着官方文档去试试:https: ...

bbird2018 发布于 2018-10-23 17:07 评论(0)阅读(547)
0

机器学习-聚类Clustering

简介 前面介绍的线性回归,SVM等模型都是基于数据有标签的监督学习方法,本文介绍的聚类方法是属于无标签的无监督学习方法。其他常见的无监督学习还有密度估计,异常检测等。 聚类就是对大量未知标注的数据集,按照数据的内在相似性将数据集划分为多个类别(在聚类算法中称为簇),使类别内的数据相似度高,二类别间的 ...

hiyoung 发布于 2018-10-20 14:29 评论(0)阅读(557)
0

机器学习-支持向量机SVM

简介: 支持向量机(SVM)是一种二分类的监督学习模型,他的基本模型是定义在特征空间上的间隔最大的线性模型。他与感知机的区别是,感知机只要找到可以将数据正确划分的超平面即可,而SVM需要找到间隔最大的超平面将数据划分开。所以感知机的超平面可以有无数个,但是SVM的超平面只有一个。此外,SVM在引入核 ...

hiyoung 发布于 2018-10-19 12:21 评论(0)阅读(88)
0

CVPR-2018 那些有趣的新想法

Taylor Guo @ Shanghai - 2018.10.18 缘起 还有什么比顶级会议更适合寻找有趣新想法的地方吗?我们从CVPR 2018 计算机视觉和模式识别的顶级会议中发现了很多有趣的东西。 GAN和CV 寻找室外场景中的小脸 寻找室外场景中的小脸 用生成性对抗网络寻找小小脸 在沙特和 ...

taylorguo 发布于 2018-10-18 19:03 评论(0)阅读(1126)
0

2019年机器学习:追踪人工智能发展之路

2019年机器学习:追踪人工智能发展之路 https://mp.weixin.qq.com/s/HvAlEohfSEJMzRkH3zZtlw 【导读】“智能助理”的时代已经到来了。机器学习已经成为全球数字化转型的关键要素之一 ,在企业领域,机器学习用例的增长在过去几年中也是显著的。预计机器学习工具和 ...

Terminator2050 发布于 2018-10-18 12:10 评论(0)阅读(351)
0

数据分析师:大数据建模,你需要了解九大形式

数据挖掘是利用业务知识从数据中发现和解释知识的过程,这种知识是以自然或者人工形式创造的新知识。 第一,目标律:业务目标是所有数据解决方案的源头。 它定义了数据挖掘的主题:数据挖掘关注解决业务业问题和实现业务目标。数据挖掘主要不是一种技术,而是一个过程,业务目标是它的的核心。 没有业务目标,没有数据挖 ...

jingsupo 发布于 2018-10-17 17:55 评论(0)阅读(3539)