0

大数据去重方案

数据库中有有一张表专门存储用户的维度数据,由于随着时间的推移,用户的维度数据也可能发生变化,故每一次查看都会保存一次记录。现在需要对数据按用户分析,但当中有大量的重复数据,仅用数据库的等值去重明显不可行。 对数据内容求MD5值 MD5值的特点: 1.压缩性:任意长度的数据,算出的MD5值长度都是固定 ...

jingsupo 发布于 2019-09-28 02:57 评论(0)阅读(1515)
0

人工智能_2_特征处理.py

# 特征处理 # 特征预处理:通过统计方法将数据转换为算法需要的数据 # 数值型数据:标准缩放 # 规依法,标准化(常用,适用于当前大数据),缺失值处理(删除,填补中位数平均数,通常按照列填补) # 类别型数据:ont-hot编码 # 时间类型:时间的切分 # 特征处理API sklearn.pre... ...

下雨天,真好 发布于 2019-09-27 14:12 评论(0)阅读(57)
0

基于python玩转人工智能最火框架之TensorFlow人工智能&深度学习介绍

https://www.cnblogs.com/xinmomoyan/p/10364825.html#_label3_2 ...

拓子 发布于 2019-09-26 22:28 评论(0)阅读(143)
0

Anaconda、TensorFlow安装和Pycharm配置详细教程,亲测有效!

[toc] 本教程仅供个人学习使用,请勿用于商业获利,造成后果自负!!! 本文首发【计算机视觉联盟】公众号,欢迎关注获取最新资料! 1、Anaconda下载与安装 (1)Anaconda下载网址:https://www.anaconda.com/distribution/ ,根据自己的系统,以及系统 ...

计算机视觉联盟 发布于 2019-09-26 09:45 评论(0)阅读(4618)
0

目标检测中常提到的IoU和mAP究竟是什么?

看完这篇就懂了。 IoU intersect over union,中文:交并比。指目标预测框和真实框的交集和并集的比例。 mAP mean average precision。是指每个类别的平均查准率的算术平均值。即先求出每个类别的平均查准率(AP),然后求这些类别的AP的算术平均值。其具体的计算 ...

程序员一一涤生 发布于 2019-09-26 09:33 评论(0)阅读(1768)
0

机器学习(2)——线性回归法

简单线性回归与最小二乘法 解决回归问题,思想简单、实现容易,许多强大的非线性模型的基础,结果具有很好的可解释性,蕴含机器学习的很多重要思想。 回归问题的横轴为特征,纵轴为输出标记,分类问题的横纵轴均为特征,颜色为输出标记。 样本特征只有一个称为简单线性回归。 因为y=|x|不是处处可导,所以我们不选 ...

MCQ1999 发布于 2019-09-25 14:42 评论(0)阅读(53)
0

Jupyter Notebooks 配置

重装了三遍(破音) 一、首先进行Anaconda的下载 然后安装,将环境配置到系统变量上,如下 然后,打开 windows 的终端,检查是否配置成功 conda -V 然后就可以开始 Jupyter Notebook 的操作了 第一次启动,会出现进入密码,然后打开 localhost:8888网页, ...

小喵钓鱼 发布于 2019-09-24 21:30 评论(0)阅读(72)
0

机器学习(1)——K近邻算法

KNN的函数写法 有时候,距离的权重可能有影响,比如: 最近的是红色,那么我们按权重来比就是对距离取倒数求和。 明科夫斯基距离: 获得了一个超参数p 查找最好的p和k(网格搜索): 使用scikit learn中的网格搜索: 定义网格参数: param_grid =[ { 'weights':['u ...

MCQ1999 发布于 2019-09-24 10:44 评论(0)阅读(72)
0

机器学习常用性能度量中的Accuracy、Precision、Recall、ROC、F score等都是些什么东西?

一篇文章就搞懂啦,这个必须收藏! 我们以图片分类来举例,当然换成文本、语音等也是一样的。 Positive 正样本。比如你要识别一组图片是不是猫,那么你预测某张图片是猫,这张图片就被预测成了正样本。 Negative 负样本。比如你要识别一组图片是不是猫,那么你预测某张图片不是猫,这张图片就被预测成 ...

程序员一一涤生 发布于 2019-09-24 10:36 评论(0)阅读(640)
1

想研究BERT模型?先看看这篇文章吧!

最近,笔者想研究BERT模型,然而发现想弄懂BERT模型,还得先了解Transformer。 本文尽量贴合Transformer的原论文,但考虑到要易于理解,所以并非逐句翻译,而是根据笔者的个人理解进行翻译,其中有一些论文没有解释清楚或者笔者未能深入理解的地方,都有放出原文,如有不当之处,请各位多多 ...

程序员一一涤生 发布于 2019-09-23 16:03 评论(0)阅读(924)
0

用深度学习做命名实体识别(五)-模型使用

通过本文,你将了解如何基于训练好的模型,来编写一个rest风格的命名实体提取接口,传入一个句子,接口会提取出句子中的人名、地址、组织、公司、产品、时间信息并返回。 核心模块entity_extractor.py 关键函数 完整代码 编写rest风格的接口 我们将采用python的flask框架来提供 ...

程序员一一涤生 发布于 2019-09-23 13:27 评论(3)阅读(780)
0

剑指Offer(三十四):第一个只出现一次的字符

剑指Offer(三十四):第一个只出现一次的字符 搜索微信公众号:'AI ming3526'或者'计算机视觉这件小事' 获取更多算法、机器学习干货 csdn:https://blog.csdn.net/baidu_31657889/ github:https://github.com/aimi cn ...

xiaoming3526 发布于 2019-09-23 10:03 评论(0)阅读(30)
0

剑指Offer(三十三):丑数

剑指Offer(三十三):丑数 搜索微信公众号:'AI ming3526'或者'计算机视觉这件小事' 获取更多算法、机器学习干货 csdn:https://blog.csdn.net/baidu_31657889/ github:https://github.com/aimi cn/AILearne ...

xiaoming3526 发布于 2019-09-23 09:52 评论(0)阅读(40)
0

论文阅读 | DeepDrawing: A Deep Learning Approach to Graph Drawing

作者:Yong Wang, Zhihua Jin, Qianwen Wang, Weiwei Cui, Tengfei Ma and Huamin Qu 本文发表于VIS2019, 来自于香港科技大学的可视化小组(屈华民教授领导)的研究 1. 简介 图数据广泛用于各个领域,例如生物信息学,金融和社交 ...

basasuya 发布于 2019-09-22 20:11 评论(0)阅读(183)
4

手把手教你使用Java实现一个神经网络

首先看一下运行效果: 下面是项目整体目录: 0.实现神经网络总览 神经网络由层、神经元、权重、激活函数和偏置组成。每层都有一个或者多个神经元,每一个神经元都和神经输入/输出连接,这些连接就是权重。 需要重点强调一下,一个神经网络可能有很多隐含层,也可能一个没有,因为每层的神经元数目也可能不同。然而, ...

秃桔子 发布于 2019-09-22 13:12 评论(1)阅读(1205)
0

快速傅里叶变换及python代码实现

0 前言 我想认真写好快速傅里叶变换(Fast Fourier Transform,FFT),所以这篇文章会由浅到细,由窄到宽的讲解,但是傅里叶变换对于寻常人并不是很容易理解的,所以对于基础不牢的人我会通过前言普及一下相关知识。 我们复习一下三角函数的标准式: $$y=A\cos (\omega x ...

凌逆战 发布于 2019-09-20 19:18 评论(1)阅读(5284)
0

BatchNorm

原理——BatchNorm就是在深度神经网络训练过程中使得每一层神经网络的输入保持相同分布;若对神经网络每一层做归一化,会使每一层输出为标准正太分布,会使神经网络完全学习不到特征; [ 说明——(适用于从整体分布看)图片28*28,通道3,批次10,BatchNorm就是在归一化10个批次中的所有图 ...

你说啥我听不见 发布于 2019-09-20 14:57 评论(0)阅读(427)
0

从Odds:比值比推导出Logtic分类的算法

在 "从概率模型推导出逻辑回归算法模型" 的博文中,我试着从李宏毅老师的课程中讲到的概率模型去推导逻辑分类的算法模型。有幸看到另外一篇博文 "01 分类算法 Logistic回归 Logit函数" ,我了解到另外一种分类模型的推导:从比值比推导。 比值比 首先了解什么是比值比: 比值比(优势比)Od ...

bbird2018 发布于 2019-09-19 11:09 评论(0)阅读(148)
0

设计师如何管理自己的文档

随着项目的积累,我们的文件目录会变得十分的盘大,如果不好好管理,将会变得一团糟,有时会影响到我们工作的效率与心情,好的文档管理方式会在一定程度上让我们的工作更加有序,即时文件目录再多,按照已经制定好的规则,也能够快速的查询到目标文件。这次就我个人研究对比,做一次小的分享,希望能对大家有所帮助。 ...

uedart 发布于 2019-09-18 21:04 评论(0)阅读(206)
0

做一个logitic分类之鸢尾花数据集的分类

Iris 鸢尾花数据集是一个经典数据集,在统计学习和机器学习领域都经常被用作示例。我试着用numpy去做一个分类算法。 ...

bbird2018 发布于 2019-09-18 18:38 评论(0)阅读(286)