随笔分类 - 机器学习
摘要:决策树的构建满足信息熵增益最大化原则 决策树的优点: 可解释性高 能处理非线性的数据 不需要数据归一化 可以用于特征工程 对数据分布没有偏好 广泛使用 容易软件实现 可以转化为规则 决策树的弱点 启发式生成,不是最优解 容易过拟合 微小的数据改变会改变整个树的形状 对类别不平衡的数据不友好 随机森林
阅读全文
摘要:支持向量机(svm)英文为Support Vector Machines 第一次接触支持向量机是2017年在一个在线解密游戏“哈密顿行动”中的一个关卡的二分类问题,用到了台湾教授写的svm库libsvm ‘C ’版。支持向量机在深度学*之前统治了机器学**10年,机器学*有个没有免费的午餐定理,意思
阅读全文
摘要:机器学习的分类: 监督学习:带标签 回归:连续 分类:离散 无监督学习 聚类:无标签,异常检测,降维 强化学习:试错 机器学习流程: 1.数据获取 2.数据清洗 3.特征工程 4.预处理 5.选择学习模型 6. 7.模型部署 数据预处理 特征提取:特征工程 处理缺失数据:均值、众数、聚类、丢弃 数据
阅读全文

浙公网安备 33010602011771号