随笔分类 - 机器学习
摘要:本系列为吴恩达斯坦福CS229机器学习课程笔记整理,以下为笔记目录: (一)线性回归 (二)逻辑回归 (三)神经网络 (四)算法分析与优化 (五)支持向量机 (六)K-Means (七)特征降维 (八)异常检测 (九)推荐系统 (十)大规模机器学习 第三章 神经网络 一、再论0/1分类问题 通过对特
阅读全文
摘要:本系列为吴恩达斯坦福CS229机器学习课程笔记整理,以下为笔记目录: (一)线性回归 (二)逻辑回归 (三)神经网络 (四)算法分析与优化 (五)支持向量机 (六)K-Means (七)特征降维 (八)异常检测 (九)推荐系统 (十)大规模机器学习 第二章 逻辑回归 使用线性回归来处理 0/1 分类
阅读全文
摘要:本系列为吴恩达斯坦福CS229机器学习课程笔记整理,以下为笔记目录: (一)线性回归 (二)逻辑回归 (三)神经网络 (四)算法分析与优化 (五)支持向量机 (六)K-Means (七)特征降维 (八)异常检测 (九)推荐系统 (十)大规模机器学习 第一章 线性回归 一、ML引言 学习行为,定制服务
阅读全文
摘要:本系列为李航《统计学习方法》学习笔记整理,以下为目录: (一)统计学习方法概论 (二)感知机 (三)k近邻 (四)朴素贝叶斯 (五)决策树 (六)逻辑斯蒂回归与最大熵模型 (七)支持向量机 (八)提升方法 (九)EM算法及其推广 (十)隐马尔科夫模型 (十一)条件随机场 第一章 统计学习方法概论 统
阅读全文
摘要:前言 本系列为机器学习算法的总结和归纳,目的为了清晰阐述算法原理,同时附带上手代码实例,便于理解。 目录 k近邻(KNN) 决策树 线性回归 逻辑斯蒂回归 朴素贝叶斯 支持向量机(SVM) 组合算法(Ensemble Method) K-Means 机器学习算法总结 本章总结十大算法,并附带经典算法
阅读全文
摘要:前言 本系列为机器学习算法的总结和归纳,目的为了清晰阐述算法原理,同时附带上手代码实例,便于理解。 目录 k近邻(KNN) 决策树 线性回归 逻辑斯蒂回归 朴素贝叶斯 支持向量机(SVM) 组合算法(Ensemble Method) K-Means 机器学习算法总结 本章为集成学习,简单介绍下Boo
阅读全文
摘要:前言 本系列为机器学习算法的总结和归纳,目的为了清晰阐述算法原理,同时附带上手代码实例,便于理解。 目录 k近邻(KNN) 决策树 线性回归 逻辑斯蒂回归 朴素贝叶斯 支持向量机(SVM) 组合算法(Ensemble Method) K-Means 机器学习算法总结 一、简介 1 概述 支持向量机(
阅读全文
摘要:前言 本系列为机器学习算法的总结和归纳,目的为了清晰阐述算法原理,同时附带上手代码实例,便于理解。 目录 k近邻(KNN) 决策树 线性回归 逻辑斯蒂回归 朴素贝叶斯 支持向量机(SVM) 组合算法(Ensemble Method) K-Means 机器学习算法总结 本章为逻辑斯蒂回归,内容包括模型
阅读全文
摘要:前言 本系列为机器学习算法的总结和归纳,目的为了清晰阐述算法原理,同时附带上手代码实例,便于理解。 目录 k近邻(KNN) 决策树 线性回归 逻辑斯蒂回归 朴素贝叶斯 支持向量机(SVM) 组合算法(Ensemble Method) K-Means 机器学习算法总结 本章为朴素贝叶斯,内容包括模型介
阅读全文
摘要:前言 本系列为机器学习算法的总结和归纳,目的为了清晰阐述算法原理,同时附带上手代码实例,便于理解。 目录 k近邻(KNN) 决策树 线性回归 逻辑斯蒂回归 朴素贝叶斯 支持向量机(SVM) 组合算法(Ensemble Method) K-Means 机器学习算法总结 本章为k近邻算法,内容包括模型介
阅读全文
摘要:前言 本系列为机器学习算法的总结和归纳,目的为了清晰阐述算法原理,同时附带上手代码实例,便于理解。 目录 k近邻(KNN) 决策树 线性回归 逻辑斯蒂回归 朴素贝叶斯 支持向量机(SVM) 组合算法(Ensemble Method) K-Means 机器学习算法总结 本章为线性回归,内容包括模型介绍
阅读全文
摘要:前言 本系列为机器学习算法的总结和归纳,目的为了清晰阐述算法原理,同时附带上手代码实例,便于理解。 目录 k近邻(KNN) 决策树 线性回归 逻辑斯蒂回归 朴素贝叶斯 支持向量机(SVM) 组合算法(Ensemble Method) K-Means 机器学习算法总结 本章为决策树算法,内容包括基本模
阅读全文
摘要:前言 本系列为机器学习算法的总结和归纳,目的为了清晰阐述算法原理,同时附带上手代码实例,便于理解。 目录 k近邻(KNN) 决策树 线性回归 逻辑斯蒂回归 朴素贝叶斯 支持向量机(SVM) 组合算法(Ensemble Method) K-Means 机器学习算法总结 本章主要介绍无监督学习中的k-m
阅读全文
摘要:特征工程是机器学习当中很重要的部分,可以帮助我们设计、创建新特征,以便模型从中提取重要相关性。本文将记录并持续更新相关特征工程的工具包介绍,包括自动模型选择和超参数调优等各方面。 · Featuretools Featuretools 是一个开源的Python 库,用于自动化特征工程。自动特征工程能
阅读全文
摘要:当特征选择完成后,可以直接训练模型了,但是可能由于特征矩阵过大,导致计算量大,训练时间长的问题,因此降低特征矩阵维度也是必不可少的。降维(dimensionality reduction)是指通过对原有的feature进行重新组合,形成新的feature,选取其中的principal compone
阅读全文
摘要:经过之前学习,单独总结一篇特征工程中的经验和方法,以助于学习和参考。 1、对于理解数据、数据的结构、特点来说,单变量特征选择是个非常好的选择。尽管可以用它对特征进行排序来优化模型,但由于它不能发现冗余(例如假如一个特征子集,其中的特征之间具有很强的关联,那么从中选择最优的特征时就很难考虑到冗余的问题
阅读全文
摘要:当数据预处理完成后,我们需要选择有意义的特征输入机器学习的算法和模型进行训练。通常来说,从两个方面考虑来选择特征: · 特征是否发散:如果一个特征不发散,例如方差接近于0,也就是说样本在这个特征上基本上没有差异,这个特征对于样本的区分并没有什么用。 · 特征与目标的相关性:这点比较显见,与目标相关性
阅读全文
摘要:本文将以iris数据集为例,梳理数据挖掘和机器学习过程中数据预处理的流程。在前期阶段,已完成了数据采集、数据格式化、数据清洗和采样等阶段。通过特征提取,能得到未经处理的特征,但特征可能会有如下问题: - 不属于同一量纲 通常采用无量纲化进行处理; - 信息冗余 - 定性特征不能直接使用 通常使用哑编
阅读全文

浙公网安备 33010602011771号