随笔分类 - 机器学习
摘要:无监督学习 1、简介 无监督学习 是一种对不含标记的数据建立模型的机器学习范式。最常见的无监督学习方法是 聚类 ,就是讲无标记的数据分成几种集群,这些集群通常是根据某种相似度指标进行的,如欧氏距离(Euclidean distance),常用领域有:数据挖掘、医学影像、股票市场分析、计算机视觉、市场
阅读全文
摘要:预测模型 1、简介 预测建模(Predictive modeling)是一种用来预测系统未来行为的分析技术,它由一群能够识别独立输入变量与反馈目标关联关系的算法构成。根据观测值创建一个数学模型,然后用这个模型去预测未来发生的事情。 预测模型是用若干个可能对系统行为产生影响的特征构建的,当处理系统问题
阅读全文
摘要:创建分类器 简介: 分类是指利用数据的特性将其分类成若干类型的过程。分类与回归不同,回归的输出是实数。监督学习分类器就是用带标记的训练数 据建立一个模型,然后对未知的数据进行分类。 分类器 可以实现分类功能的任意算法,最简单的分类器就是简单的数学函数。其中有二元(binary)分类器,将数据分成两类
阅读全文
摘要:《Python机器学习经典实例》2.9小节中,想自己动手实践汽车特征评估质量,所以需要对数据进行预处理,其中代码有把字符串标记编码为对应的数字,如下代码 input_data = ['vhigh', 'vhigh', '2', '2', 'small', 'low'] input_data_enco
阅读全文
摘要:监督学习 概念: 在有标记的样本(labels samples)上建立机器学习 1、数据的预处理 机器学习算法无法理解原始数据,所以需对原始数据进行预处理,常用预处理如下: 预处理主要使用了preprocessing包,所以需对该包进行导入: import numpy as np from skle
阅读全文
摘要:Tensorflow之MNIST的最佳实践思路总结 在上两篇文章中已经总结出了深层神经网络常用方法和Tensorflow的最佳实践所需要的知识点,如果对这些基础不熟悉,可以返回去看一下。在 "《Tensorflow:实战Google深度学习框架》" 这本书在第五章中给出了MN
阅读全文
摘要:机器学习算法无法理解原始数据,所以需对原始数据进行预处理,常用预处理如下: 预处理主要使用了preprocessing包,所以需对该包进行导入: 1.均值移除(Mean removal) 2.范围缩放(Scaling) 3.归一化(Normalization) 4.二值化(Binarization)
阅读全文

浙公网安备 33010602011771号