• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






许愿瓶666666

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理
上一页 1 2 3 4 下一页

2018年6月24日

时间序列分析一:单变量的传统时间序列分析
摘要: 一.基本概述 Yt = f(Tt , St ,Ct ,It ) Tt , St ,Ct ,It 分别表示时间序列t时刻的趋势成分,季节成分,循环成分,误差和无规则成分。 趋势模型:当时间序列呈现某种上升或下降的趋势,并且无明显的季节波动时,可以以时间t综合代替所有影响因素。 季节模型: 二.趋势模型 阅读全文
posted @ 2018-06-24 15:38 许愿瓶666666 阅读(2489) 评论(0) 推荐(0)
 
时间序列分析综述
摘要: 一.基本分类 1.单变量的传统时间序列分析 2.单变量的随机时间序列分析 3.多变量的时间序列分析 建立在回归基础上的两变量序列分析 建立在AR基础上的多变量序列分析 4.截面时序数据结合的分析 阅读全文
posted @ 2018-06-24 15:35 许愿瓶666666 阅读(317) 评论(0) 推荐(0)
 

2018年6月23日

训练模型:交叉验证
摘要: 一.基本概述 用交叉验证的目的是为了得到可靠稳定的模型。 消除测试集与训练集选择的不好,导致训练的模型不好。 二.k折交叉验证 K折交叉验证,初始采样分割成K个子样本,一个单独的子样本被保留作为验证模型的数据,其他K-1个样本用来训练。交叉验证重复K次,每个子样本验证一次,平均K次的结果或者使用其它 阅读全文
posted @ 2018-06-23 16:40 许愿瓶666666 阅读(1906) 评论(0) 推荐(0)
 
模型建立与评估
摘要: 一.基本概述 回归指标:均方误差 分类指标:准确率、召回率、精度、错误率 排序指标: 二、分类指标 (一)准确率、召回率、精度、错误率(二分类) 准确率/查准率(precision): 是针对预测为正的样本来说的,指的是预测为正的样本中预测正确了的百分比。 TPTP+FP 召回率/查全率(recal 阅读全文
posted @ 2018-06-23 11:38 许愿瓶666666 阅读(214) 评论(0) 推荐(0)
 
降维分析二:LDA
摘要: 基于标签进行降维 阅读全文
posted @ 2018-06-23 10:11 许愿瓶666666 阅读(115) 评论(0) 推荐(0)
 
降维算法一:PCA主成分分析
摘要: 一.基本概述 目标:提取最有价值的信息(基于方差) 寻找一个一维基,使得所有数据变换为这个基上的坐标表示后,方差值最大 当协方差为0时,表示两个字段完全独立。为了让协方差为0,选择第二个基时只能在与第一个基正交的方向上选择。因此最终选择的两个方向一定是正交的。 二.优化目标 将一组N维向量降为K维( 阅读全文
posted @ 2018-06-23 10:10 许愿瓶666666 阅读(216) 评论(0) 推荐(0)
 
聚类分析
摘要: 一.K-MEANS算法 (一)基本概念 无监督问题,不需要标签 难点:如何评估聚类结果,如何调参(也由于不能评估结果导致) k-means 要得到簇的个数,需要指定K值 质心:均值,即向量各维取平均即可 距离的度量:常用欧几里得距离和余弦相似度(先标准化) 优化目标:(k表示k个聚类中心,ci表示第 阅读全文
posted @ 2018-06-23 09:58 许愿瓶666666 阅读(571) 评论(0) 推荐(0)
 

2018年6月18日

支持向量机
摘要: 一.概述 原理:支持向量机(Support Vector Machine, SVM)的基本模型是在特征空间上找到最佳的分离超平面使得训练集上正负样本间隔最大。 SVM是用来解决二分类问题的有监督学习算法,在引入了核方法之后SVM也可以用来解决非线性问题。支持向量机是一种监督式学习的方法,可广泛地应用 阅读全文
posted @ 2018-06-18 12:35 许愿瓶666666 阅读(297) 评论(0) 推荐(0)
 

2018年6月12日

文本分析
摘要: 一、文本数据预处理 语料清洗: 停用词 评论高,但不需要(如评论数据中赞、顶) 二、分词 结巴分词 三、TF-IDF计算 1.关键词提取 词频: (一般用全部次的个数) 逆文档频率: (分母+1是为了让其永远不等于0) 2.数值矩阵 四、相似度 句子——分词——语料库(词集)——词频——词频向量 1 阅读全文
posted @ 2018-06-12 23:00 许愿瓶666666 阅读(188) 评论(0) 推荐(0)
 

2018年6月4日

贝叶斯算法
摘要: 一.贝叶斯 朴素贝叶斯的思想基础:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。通俗来说,就好比这么个道理,你在街上看到一个黑人,我问你你猜这哥们哪里来的,你十有八九猜非洲。为什么呢?因为黑人中非洲人的比率最高,当然人家也可能是美洲人或亚洲人, 阅读全文
posted @ 2018-06-04 22:38 许愿瓶666666 阅读(256) 评论(0) 推荐(0)
 
上一页 1 2 3 4 下一页