0

[深度之眼机器学习训练营第四期]过拟合与正则化

基本概念 机器学习模型面临的两个主要问题是欠拟合与过拟合。 欠拟合 ,即模型具有较高的 偏差 ,说明模型没有从数据中学到什么,如下左图所示。而 过拟合 ,即模型具有较高的 方差 ,意味着模型的经验误差低而泛化误差高,对新数据的泛化能力差,如下右图所示。 通常,欠拟合是由于模型过于简单或使用数据集的特 ...

Litt1e0range 发布于 2020-01-23 20:42 评论(0)阅读(5)
0

[深度之眼机器学习训练营第四期]对数几率回归

基本概念 对数几率回归(Logistic Regression,又称逻辑回归)可以用来解决二分类和多分类问题。分类问题中,输出集合不再是连续值,而是离散值,即$\mathcal{Y}\in \{0,1,2,\cdots\}$。以二分类问题为例,其输出集合一般为$\mathcal{Y}\in \{0, ...

Litt1e0range 发布于 2020-01-23 20:38 评论(0)阅读(4)
2

Kaggle竞赛丨入门手写数字识别之KNN、CNN、降维

引言 这段时间来,看了西瓜书、蓝皮书,各种机器学习算法都有所了解,但在实践方面却缺乏相应的锻炼。于是我决定通过Kaggle这个平台来提升一下自己的应用能力,培养自己的数据分析能力。 我个人的计划是先从简单的数据集入手如手写数字识别、泰坦尼克号、房价预测,这些目前已经有丰富且成熟的方案可以参考,之后关 ...

vincent1997 发布于 2020-01-21 15:01 评论(4)阅读(147)
0

机器学习——梯度下降法

Notation: m=number of training examples n=number of features x="input" variables / features y="output"variable/"target" variable $(x^{(i)},y^{(i)})$ = ...

呆子哥哥 发布于 2020-01-19 14:27 评论(0)阅读(14)
0

手写数字识别——基于全连接层和MNIST数据集

本文使用TensorFlow2.0手动搭建简单的全连接网络进行MNIST手写数据集的分类识别,逐步讲述实现过程,穿插TensorFlow2.0语法,文末给出完整的代码。废话少说,开始动手吧! 一、量子波动撸代码 该节先给出各代码片段,第二节将这些片段汇总成程序,这些代码片段故意包含了一些错误之处,在 ...

KenSporger 发布于 2020-01-17 19:32 评论(0)阅读(44)
0

机器学习在马蜂窝酒店聚合中的应用初探

出门旅行,订酒店是必不可少的一个环节。住得干净、舒心对于每个出门在外的人来说都非常重要。 在线预订酒店让这件事更加方便。当用户在马蜂窝打开一家选中的酒店时,不同供应商提供的预订信息会形成一个聚合列表准确地展示给用户。这样做首先避免同样的信息多次展示给用户影响体验,更重要的是帮助用户进行全网酒店实时比 ...

马蜂窝技术 发布于 2020-01-17 15:32 评论(0)阅读(200)
0

从头学pytorch(十九):批量归一化batch normalization

批量归一化 论文地址: 批量归一化基本上是现在模型的标配了 . 说实在的,到今天我也没搞明白batch normalize能够使得模型训练更稳定的底层原因,要彻底搞清楚,涉及到很多凸优化的理论,需要非常扎实的数学基础才行. 目前为止,我理解的批量归一化即把每一层输入的特征,统一变换到统一的尺度上来, ...

core! 发布于 2020-01-16 16:38 评论(0)阅读(129)
0

Neo4j集群容器化部署

集群基本配置(示例) core servers: 10.110.10.11, 10.110.10.12, 10.110.10.13read replicas: 10.110.10.14, 10.110.10.15, 10.110.10.16 Neo4j图数据库分布式架构图:(详细可参考官方文档: h ...

BattleScars 发布于 2020-01-15 19:36 评论(0)阅读(17)
0

EM算法

1、背景2、理论2.1、Jensen不等式优化理论中,假设 \(f\) 是定义域为实数的函数,如果对于所有的实数 \(x\) ,且二阶导数\(f''(x)\geq 0\) ,则 \(f\) 是凸函数。当 \(x\) 是向量时,如果其Hessian矩阵H是半正定的 (\(H \geq 0\)),那么 ... ...

peacocks 发布于 2020-01-15 13:57 评论(0)阅读(122)
0

【tf.keras】使用手册

tf.keras 使用手册。记录使用 tf.keras 时遇到的各种问题。本手册内容包括 CUDA、cuDNN 的安装,数据集加载,tf.keras没有集成的优化器(如 AdamW)的使用,自行设计 metrics 如 F1、recall、precision,模型复现、预训练模型加载、循环训练模型O... ...

wuliytTaotao 发布于 2020-01-12 20:23 评论(0)阅读(59)
0

《自然语言处理入门》笔记-第1章

自然语言处理又称计算语言学,其目标是让计算机处理或"理解"自然语言,以完成有意义的任务。 自然语言的难度 将自然语言与编程语言对比,直观的的体会自然语言的复杂程度。 自然语言词汇量大 自然语言是非结构化的,编程语言是结构化的 自然语言含有大量歧义 容错性 易变性 简略性 人类经常省略大量背景知识或尝 ...

z1xiang 发布于 2020-01-12 19:43 评论(0)阅读(33)
0

萌新深度学习与Pytorch入门记录(一):Win10下环境安装

深度学习从入门到入土,安装软件及配置环境踩了不少坑,过程中参考了多处博主给的解决方法,遂整合一下自己的采坑记录。 (若遇到不一样的错误,请参考其他博主答案解决) 笔者电脑系统为win10系统,在此环境下安装 Pycharm 5.0.3 Anaconda 3 Python 3.6.9 cuda 10. ...

Perfect_Hao 发布于 2020-01-12 18:59 评论(0)阅读(52)
0

《2018自然语言处理研究报告》整理(附报告)

这篇文章是阅读AMiner《2018自然语言处理研究报告》前几篇内容整理所得。 ...

z1xiang 发布于 2020-01-11 23:34 评论(0)阅读(52)
0

Coursera-吴恩达机器学习课程笔记-Week2

参考资料: "吴恩达教授机器学习课程" "机器学习课程中文笔记" Week2 一. 多变量线性回归(Linear Regression with Multiple Variables) 多变量就时当一个example里有n个特征的情况,将n个特征统一到一个matrix里去看作整体。 多变量线性回归还 ...

z1xiang 发布于 2020-01-11 23:29 评论(0)阅读(39)
0

Coursera-吴恩达机器学习课程笔记-Week1

参考资料: "吴恩达教授机器学习课程" "机器学习课程中文笔记" Week 1 一. 引言 机器学习模型可分为监督学习Superviese learning(每个数据集给出了正确的值)和无监督学习Unsupervised learning(数据集只有特征,没有对应正确的值) 机器学习处理的问题可以分 ...

z1xiang 发布于 2020-01-11 23:25 评论(0)阅读(34)
0

从头学pytorch(十六):VGG NET

VGG AlexNet在Lenet的基础上增加了几个卷积层,改变了卷积核大小,每一层输出通道数目等,并且取得了很好的效果.但是并没有提出一个简单有效的思路. VGG做到了这一点,提出了可以通过重复使⽤简单的基础块来构建深度学习模型的思路. 论文地址: vgg的结构如下所示: 上图给出了不同层数的vg ...

core! 发布于 2020-01-10 22:54 评论(0)阅读(131)
0

神经网络之反向传播算法(BP)公式推导(超详细)

反向传播算法详细推导 反向传播(英语:Backpropagation,缩写为BP)是“误差反向传播”的简称,是一种与最优化方法(如梯度下降法)结合使用的,用来训练人工神经网络的常见方法。该方法对网络中所有权重计算损失函数的梯度。这个梯度会反馈给最优化方法,用来更新权值以最小化损失函数。 在神经网络上 ...

jsfantasy 发布于 2020-01-10 17:27 评论(0)阅读(31)
0

深度学习之反向传播算法(BP)代码实现

反向传播算法实战 本文仅仅是反向传播算法的实现,不涉及公式推导,如果对反向传播算法公式推导不熟悉,强烈建议查看另一篇文章 "神经网络之反向传播算法(BP)公式推导(超详细)" 我们将实现一个 层的全连接网络,来完成二分类任务。网络输入节点数为 ,隐藏 层的节点数设计为: 和`25 1` 的概率和类别 ...

jsfantasy 发布于 2020-01-10 17:20 评论(0)阅读(28)
0

[深度之眼机器学习训练营第四期]线性回归

基本概念 首先看一下基本的概念与符号。$x^{(i)}$表示输入变量,也就是 特征 ,$y^{(i)}$表示输出变量,也被称为 标签 或 目标 。二者组成的元组$(x^{(i)},y^{(i)})$就表示一个训练样本,而$n$个这样的训练样本就组成了训练集,即$\{(x^{(i)} , y^{(i) ...

Litt1e0range 发布于 2020-01-10 12:16 评论(0)阅读(19)
1

Pandas 数据分析,高中体测练习

分析体测成绩 需求: 体侧成绩转变成分数 开卷考试 excel完成可以 pandas读取excel代码中 完成 一个手输入 进一步,画图,分布,体重正常,肥胖,偏瘦比例,绘制饼图 男生跑步1000成绩,不及格,及格,中等,良好,优秀,柱状图绘制 导包、读取文件 import numpy as np​ ...

quietz 发布于 2020-01-09 11:23 评论(1)阅读(44)