• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






许愿瓶666666

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理
上一页 1 2 3 4 下一页

2018年6月4日

集成(提升)算法:随机森林
摘要: 一.集成算法概述 目的:让机器学习效果更好 二.集成方法(基础模型:树模型比较合适) 1.Bagging(并行) 训练多个分类器取平均,并行训练一堆分类器 随机森林 随机:数据采样随机(60%-80%有放回随机采样),特征选择随机(60%-80%有放回随机采样) 备注:每棵树数据量和特征数量相同 森 阅读全文
posted @ 2018-06-04 22:36 许愿瓶666666 阅读(246) 评论(0) 推荐(0)
 
决策树
摘要: 一.决策树概念 决策树:从根节点开始一步步走到叶子节点 节点(特征): 根节点:第一个选择点 非叶子节点与分支:中间过程 叶子节点:最终的决策结果(容易理解错误) 增加节点相当于在数据中切一刀(节点并不是越多越好) 说明:所有的数据最终都会落到叶子节点;决策树既可以做分类也可以做回归 例子:一家人谁 阅读全文
posted @ 2018-06-04 22:26 许愿瓶666666 阅读(170) 评论(0) 推荐(0)
 

2018年5月24日

逻辑回归算法(二分类)
摘要: 一、逻辑回归算法简介 目的:经典的二分类算法 机器学习算法选择:先逻辑回归再复杂算法 决策边界:可以是非线性的 逻辑回归算法分三步(原理):(1)需要确定一个预测函数,即预测出一个值来判断归属哪一类,可定义预测值大于某个阈值判断为一类,反之为另一类;(2)为了计算参数,我们需要定义一个损失函数,损失 阅读全文
posted @ 2018-05-24 23:00 许愿瓶666666 阅读(2708) 评论(0) 推荐(0)
 
机器学习中的目标函数与损失函数
摘要: 一、基本简介 损失函数(代价函数):对于目标函数来说在有约束条件下的最小化就是损失函数。(度量模型的拟合程度) 公式: 目标函数:更广的概念。 最优化经验风险和结构风险,而这个函数就被称为目标函数。(风险函数是损失函数的期望。) 经验风险最小化: 结构风险最小化(度量模型的复杂度): 公式: 二、详 阅读全文
posted @ 2018-05-24 22:21 许愿瓶666666 阅读(399) 评论(0) 推荐(0)
 

2018年5月17日

探索性数据分析(EDA)
摘要: 一.描述性统计分析 1.定性变量 频率 频数 2.定量变量 集中趋势的度量:均值、众数、中位数、四分位 变异程度的度量:极差、方差、标准差 相对位置的度量:标准得分 偏度和峰度: 阅读全文
posted @ 2018-05-17 16:33 许愿瓶666666 阅读(216) 评论(0) 推荐(0)
 
市场营销环境分析的方法
摘要: 一、有形产品的分析 市场营销环境分为外部环境分析和市场环境分析 1、外部环境分析包括: 一般环境分析:所处经济体相关的经济形势、政策导向、技术发展水平和社会导向(如人们的价值观、产品使用习惯等)还有人口统计变量(如男女比例、年龄分布、教育程度分布等); 产业环境分析:波特的五力模型和产品生命周期(参 阅读全文
posted @ 2018-05-17 11:18 许愿瓶666666 阅读(1894) 评论(0) 推荐(0)
 
市场分析常用模型
摘要: 一、宏观环境分析 1、PEST分析——从外部宏观角度分析。PEST 为一种企业所处宏观环境分析模型,所谓PEST即 Political(政治), Economic(经济), Social(社会) and Technological(科技). 这些是企业的外部环境,一般不受企业掌握,这些因素也被戏称为 阅读全文
posted @ 2018-05-17 11:08 许愿瓶666666 阅读(2280) 评论(0) 推荐(0)
 

2018年5月16日

模型优化算法二:最陡峭下降(梯度下降)
摘要: 一、梯度下降算法简介 机器学习的套路就是我交给机器一堆数据,然后告诉它什么样的学习方式是对的(目标函数),然后让它朝着这个方向去做。 二、梯队下降算法求线性回归参数 目标函数: (推导过程可参照线性回归部分) 下山的步骤(更新参数) 找到 当前最合适的方向(偏导) 走一小步,快了容易跌倒(步长,又叫 阅读全文
posted @ 2018-05-16 10:55 许愿瓶666666 阅读(436) 评论(0) 推荐(0)
 

2018年5月15日

数据挖掘算法的组件化思想
摘要: 一、数据挖掘功能 (1) 频繁模式(Frequent Patterns)(2) 分类(Classification)(3) 聚类(Cluster Analysis)(4) 异常检测(Outlier Detection) 二、学习组件化思想的目的 许多著名的数据挖掘算法都是由五个“标准组件”构成的,即 阅读全文
posted @ 2018-05-15 17:48 许愿瓶666666 阅读(1630) 评论(0) 推荐(0)
 
模型优化方法一:爬山
摘要: 一、爬山算法简单描述 简介:爬山法是一种优化算法,其一般从一个随机的解开始,然后逐步找到一个最优解(局部最优)。假定所求问题有多个参数,我们在通过爬山法逐步获得最优解的过程中可以依次分别将某个参数的值增加或者减少一个单位。 思想:每次拿相邻点与当前点进行比对,取两者中较优者,作为爬坡的下一步。 主要 阅读全文
posted @ 2018-05-15 17:43 许愿瓶666666 阅读(1079) 评论(0) 推荐(0)
 
上一页 1 2 3 4 下一页