随笔分类 -  ZZZ

摘要:前言 在数据集上训练神经网络时,主要有两个目标: 定义符合数据集特性的神经网络架构。 在许多试验中对一组超参数进行调优,从而使得模型具有较高的准确率并且能够泛化至训练集和测试集之外的数据。 针对不同的数据集和问题,往往需要进行几十至上百次的实验,花费几百到上千小时的计算时间,才能找到神经网络架构和超 阅读全文
posted @ 2019-06-25 22:48 Anliven
摘要:1 - Iris数据集 Iris数据集是常用的机器学习分类实验数据集,特点是数据量很小,可以快速学习。 数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性。 Sepal.Length(花萼长度),单位是cm Sepal.Width(花萼宽度),单位是cm Petal.Lengt 阅读全文
posted @ 2019-06-24 23:54 Anliven
摘要:安装的要求 H2O的安装对操作系统、编程语言和浏览器有具体的要求。 详情请查看官方信息 下载H2O Downloading & Installing H2O Download 示例 - 在CentOS7.5中直接运行 官网信息 查看系统及Java信息 [Anliven@localhost ~]$ u 阅读全文
posted @ 2019-06-21 23:33 Anliven
摘要:1 - AutoML AutoML(自动化机器学习)是将机器学习应用于现实问题的自动化端到端过程。 安装一个程序库/使用一个web接口 将程序库/接口指向数据 自动在数据上训练模型,无需调整参数/深入了解驱动它的算法 AutoML定义 简单来说就是一种自动化任务的方法: 预处理并清理数据。 选择并构 阅读全文
posted @ 2019-06-04 00:10 Anliven
摘要:保存和恢复模型(Save and restore models) 官网示例:https://www.tensorflow.org/tutorials/keras/save_and_restore_models 在训练期间保存检查点 在训练期间或训练结束时自动保存检查点。权重存储在检查点格式的文件集合 阅读全文
posted @ 2019-05-05 23:49 Anliven
摘要:过拟合与欠拟合(Overfitting and underfitting) 官网示例:https://www.tensorflow.org/tutorials/keras/overfit_and_underfit主要步骤: 演示过拟合 - 创建基准模型 - 创建一个更小的模型 - 创建一个更大的模型 阅读全文
posted @ 2019-05-05 23:28 Anliven
摘要:基本回归 回归(Regression):https://www.tensorflow.org/tutorials/keras/basic_regression 主要步骤:数据部分 获取数据(Get the data) 清洗数据(Clean the data) 划分训练集和测试集(Split the 阅读全文
posted @ 2019-04-27 08:36 Anliven
摘要:影评文本分类 官网示例:https://www.tensorflow.org/tutorials/keras/basic_text_classification主要步骤: 1.加载IMDB数据集 2.探索数据:了解数据格式、将整数转换为字词 3.准备数据 4.构建模型:隐藏单元、损失函数和优化器 5 阅读全文
posted @ 2019-03-28 00:11 Anliven
摘要:基本分类 官网示例:https://www.tensorflow.org/tutorials/keras/basic_classification主要步骤: 加载Fashion MNIST数据集 探索数据:了解数据集格式 预处理数据 构建模型:设置层、编译模型 训练模型 评估准确率 做出预测:可视化 阅读全文
posted @ 2019-03-27 23:44 Anliven
摘要:原文链接:https://yq.aliyun.com/topic/111 本文是对原文内容中部分概念的摘取记录,可能有轻微改动,但不影响原文表达。 08 - BP算法双向传,链式求导最缠绵 反向传播(Back Propagation,简称BP) 算法 在神经网络(甚至深度学习)参数训练中,BP算法占 阅读全文
posted @ 2019-03-06 00:01 Anliven
摘要:原文链接:https://yq.aliyun.com/topic/111 本文是对原文内容中部分概念的摘取记录,可能有轻微改动,但不影响原文表达。 01 - 一入侯门“深”似海,深度学习深几许 什么是“学习”? “如果一个系统,能够通过执行某个过程,就此改进了它的性能,那么这个过程就是学习”。 学习 阅读全文
posted @ 2019-02-28 00:11 Anliven
摘要:过拟合 过拟合(overfitting,过度学习,过度拟合): 过度准确地拟合了历史数据(精确的区分了所有的训练数据),而对新数据适应性较差,预测时会有很大误差。 过拟合是机器学习中常见的问题,解决方法主要有下面几种: 1. 增加数据量 大部分过拟合产生的原因是因为数据量太少。 2. 运用正则化 例 阅读全文
posted @ 2019-02-26 00:01 Anliven
摘要:分类与回归 分类(Classification)与回归(Regression)的区别在于输出变量的类型。通俗理解,定量输出称为回归,或者说是连续变量预测;定性输出称为分类,或者说是离散变量预测。回归问题的预测结果是连续的,通常是用来预测一个值,如预测房价、未来的天气情况等等。一个比较常见的回归算法是 阅读全文
posted @ 2019-02-25 22:44 Anliven
摘要:TensorBoard TensorFlow自带的可视化工具,能够以直观的流程图的方式,清楚展示出整个神经网络的结构和框架,便于理解模型和发现问题。 可视化学习:https://www.tensorflow.org/guide/summaries_and_tensorboard 图的直观展示:htt 阅读全文
posted @ 2019-02-23 23:38 Anliven
摘要:张量(Tensor) 在Tensorflow中,变量统一称作张量(Tensor)。 张量(Tensor)是任意维度的数组。 0阶张量:纯量或标量 (scalar), 也就是一个数值,例如,\'Howdy\' 或 5 1阶张量:向量 (vector)或矢量,也就是一维数组(一组有序排列的数),例如,[ 阅读全文
posted @ 2019-02-22 00:08 Anliven
摘要:Hello world 1 # coding=utf-8 2 import tensorflow as tf 3 import os 4 5 os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2' 6 7 try: 8 tf.contrib.eager.enable_eag 阅读全文
posted @ 2019-02-19 23:39 Anliven
摘要:01 - 基本的神经网络结构 输入端 》神经网络(黑盒) 》输出端 输入层:负责接收信息 隐藏层:对输入信息的加工处理 输出层:计算机对这个输入信息的认知 每一层点开都有它相应的内容,函数和功能。一般来说, 神经网络(Neural Network)是一连串神经层所组成的把输入进行加工再输出的系统。 阅读全文
posted @ 2019-02-14 23:40 Anliven
摘要:机器学习入门 - Google机器学习速成课程 - 笔记汇总 机器学习入门 - Google机器学习速成课程 https://www.cnblogs.com/anliven/p/6107783.html MLCC简介 前提条件和准备工作 完成课程的下一步 机器学习入门01 - 框架处理(Framin 阅读全文
posted @ 2019-02-05 15:06 Anliven
摘要:除了实现机器学习算法之外,机器学习还包含许多其他内容。生产环境机器学习系统包含大量组件。无需自行构建所有内容,而是应该尽可能重复使用常规机器学习系统组件。通过了解机器学习系统的一些范例及其要求,可以明确实际需要哪些组件。 1- 静态训练与动态训练(Static vs. Dynamic Trainin 阅读全文
posted @ 2019-02-03 00:26 Anliven
摘要:一些常见的入门数据集 MNIST MNIST(Mixed National Institute of Standards and Technology database)是一个计算机视觉数据集。 官方下载地址:http://yann.lecun.com/exdb/mnist/ 包含70000张手写数 阅读全文
posted @ 2019-02-02 23:47 Anliven