摘要: 10 逻辑回归 分类算法 逻辑回归 应用场景 (二分类) 广告点击率 (典型的二分类问题,点了或者没点,也能得出) 是否为垃圾邮件 是否患病 金融诈骗 虚假账号 逻辑回归定义 1. 逻辑回归: 是一种分类算法,使用线性回归的式子作为输入,通过sigmoid函数转换为概率问题。 2. sigmoid函 阅读全文
posted @ 2019-12-03 21:15 JoyLake 阅读(321) 评论(0) 推荐(0) 编辑
摘要: 09 线性回归及矩阵运算 线性回归 1. 定义:通过一个或者多个自变量与因变量之间进行建模的回归分析。其中可以为一个或者多个自变量之间的线性组合。 2. 一元线性回归:涉及到的变量只有一个 多元线性回归:变量两个或以上 3. 通用公式:h(w) = w0 + w1x1 + w2x2 + ....= 阅读全文
posted @ 2019-12-01 11:15 JoyLake 阅读(1567) 评论(0) 推荐(0) 编辑
摘要: 08 决策树与随机森林 决策树之信息论基础 认识决策树 1. 来源: 决策树的思想来源非常朴素,程序设计中的条件分支结构就是if then 结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法。 2. 举例:是否见相亲对象 信息的度量和作用 1. 克劳德 .艾尔伍德 .香农:信息论创始人,密 阅读全文
posted @ 2019-11-25 22:47 JoyLake 阅读(608) 评论(0) 推荐(0) 编辑
摘要: 07 朴素叶贝斯算法 概率基础 1. 概率: 一件事情发生的可能性 2. 联合概率: 包含多个条件,且所有条件同时成立的概率。P(A,B) P(A, B) = P(A)P(B) 3. 条件概率:事件A在另外一个事件B已经发生条件下发生的概率。 P(A|B) P(A1,A2 | B) = P(A1 | 阅读全文
posted @ 2019-11-21 23:20 JoyLake 阅读(821) 评论(0) 推荐(0) 编辑
摘要: k 近邻算法 算法介绍 1. 定义: 如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一类别,则该样本也属于这个类别。 2. 计算距离公式:欧式距离 (两点之间距离) 3. 需要做标准化处理,防止某一类特征值权重过大 4. Sklearn API sklearn.ne 阅读全文
posted @ 2019-11-13 00:05 JoyLake 阅读(305) 评论(0) 推荐(0) 编辑
摘要: 05 机器学习开发流程 数据类型 离散型数据 定义:记录不同类别个体的数目得到的数据,又称计数数据。这些数据全是整数,且不能再细分,也不能进一步提高他们的精度。 如:3.6个人 连续型数据: 定义:变量可以在某个范围内取任一整数,即变量的取值可以是连续的,如,长度、时间、质量值等,通常含有小数部分。 阅读全文
posted @ 2019-11-11 20:47 JoyLake 阅读(248) 评论(0) 推荐(0) 编辑
摘要: 04 数据降维 降维: 降低特征的数量 特征选择 主成分分析 特征选择: 特征选择的原因 冗余:部分特征的相关度高,容易消耗计算性能 噪声:部分特征对计算结构有影响 特征选择是什么? 1. 定义: 特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征,特征在选择前和选择后可以改变值,也可 阅读全文
posted @ 2019-11-10 18:33 JoyLake 阅读(242) 评论(0) 推荐(0) 编辑
摘要: 03 数据特征预处理 特征的预处理 特征的预处理 1. 定义:通过特定的统计方法(数学方法),将数据转换成算法要求的数据。 2. 数值型数据:标准缩放 归一化 标准化 3. 类别性数据: one hot编码 4. 时间类型: 时间的切分 归一化 1. 定义: 通过对原始数据的变化把数据映射到 [0, 阅读全文
posted @ 2019-11-09 20:24 JoyLake 阅读(222) 评论(0) 推荐(0) 编辑
摘要: 02 特征工程和文本特征提取 数据集的构成 数据存放形式 1. CSV 文件 2. mysql: 性能瓶颈,读取速度; 格式不符合机器学习的格式 3. pandas:读取工具 4. numpy为什么读取速度快: 动态语言 全局解释性锁 GIL : 释放了 (GIL数据安全),真正的多线程 可用的数据 阅读全文
posted @ 2019-11-09 14:58 JoyLake 阅读(740) 评论(0) 推荐(0) 编辑
摘要: 01 机器学习介绍 人工智能的发展 1. 人工智能 机器学习 深度学习 机器学习的用途 图像识别 CV 1. 无人驾驶 2. 医疗 识别CT图细微区别 3. 图片艺术化 4. iphone 人脸识别 自然语言处理 NLP 1. 新闻自动生成机器人 传统预测 1. 信贷、销量预测 机器学习库和框架 1 阅读全文
posted @ 2019-11-09 14:54 JoyLake 阅读(184) 评论(0) 推荐(0) 编辑