随笔分类 -  Machine Learning

机器学习
摘要:间隔、对偶、核技巧 一、硬间隔支持向量机 1.1 模型定义 硬间隔分类器也作最大间隔分类器:确保两类的特征点到决策面$y=w^Tx+b$距离最大。 由于目的是分类,故引入$sign(y)$函数 $$ sign(y)=\left\{\begin{matrix} +1 & y 0\\ 1 & y0&y_ 阅读全文
posted @ 2020-02-23 11:41 mhp 阅读(223) 评论(0) 推荐(0)
摘要:一、连续值和缺省值的处理 1.1 连续值 处理数据中的连续值,如下图的含糖率: 基本思路:连续属性离散化 常见做法:二分法 n个属性形成n 1个候选区域 1 17个🍉,含糖率有17个值 划分为16个区域 每个区域的中点作为划分点 把候选区域当作离散值处理,寻找最佳划分 根据最佳属性选择方法选取最优 阅读全文
posted @ 2020-02-23 11:37 mhp 阅读(1113) 评论(0) 推荐(0)
摘要:一、决策树的模型概述 决策树基于树结构进行决策(🍉): 内部节点:对应某个属性,应用于某个属性的测试(色泽) 分支:对应测试产生的可能结果,对应于属性的某个值(红、绿) 叶子节点:对应测试结果 学习过程:通过对训练样本的分析来确定划分属性(内部节点的属性) 预测过程:将待测数据从根结点开始,沿着划 阅读全文
posted @ 2020-02-23 11:35 mhp 阅读(922) 评论(0) 推荐(0)
摘要:一、线性模型 1.1 线性模型 线性模型:试图学得一个 属性的线性组合 来进行预测的函数 $$ f(x) = w_1x_1+w_2x_2+..+w_dx_d+b $$ 向量模式: $$ f(x)=w^Tx+b $$ 简单、基本、可解释性好 (可看出每部分属性所做的贡献) 可用于分类和回归 1.2 线 阅读全文
posted @ 2020-02-20 18:16 mhp 阅读(606) 评论(0) 推荐(0)