• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
WFiresun
博客园    首页    新随笔    联系   管理    订阅  订阅

随笔分类 -  BigData

7.Mahout菩萨

摘要:1.Maout简介 2.机器学习介绍 3.Mahout算法介绍 阅读全文
posted @ 2019-05-21 15:32 WFiresun 阅读(134) 评论(0) 推荐(0)
6.HBase时髦谨慎财会会计

摘要:1.基本概念和原理 2.核心知识点 3.安装部署 4.Hbase开发 阅读全文
posted @ 2019-05-21 15:18 WFiresun 阅读(218) 评论(0) 推荐(0)
5.Hiveguigun滚(ノ`Д)ノ竟然竞争谨慎谨慎谨慎哈喇子罢工八公

摘要:1、Hive简介 2.Hive部署与安装 3.Hive的使用 4.Hive JDBC编程 阅读全文
posted @ 2019-05-21 14:50 WFiresun 阅读(150) 评论(0) 推荐(0)
4.HadoopMapRe程序设计

摘要:1.介绍 2.基本构架与组件 3。基本算法 阅读全文
posted @ 2019-05-21 11:43 WFiresun 阅读(165) 评论(0) 推荐(0)
9.聚类分析

摘要:1.什么是聚类 聚类:数据对象的集合/蔟 2.聚类的一般应用 模式识别 空间数据分析 图象处理 经济科学 3.聚类方法 数据挖掘对聚类的要求 4.聚类分析中的数据类型 数据结构 相异度矩阵 评估聚类的质量 区间标度变量 对象之间的相似性/相异性 二元变量,对称的,不对称的 标称变量-分类变量,名义变 阅读全文
posted @ 2019-05-16 11:58 WFiresun 阅读(169) 评论(0) 推荐(0)
7.分类:基本概念 忌讳

摘要:1.有监督 vs 无监督学习 2.预测问题:分类 vs 数值预测 3.分类:模型构建 模型使用 4.决策树归纳分类 什么是决策树 决策树的生成有两个阶段组成 : 决策树构建、树剪枝 决策树的使用:对未知样本进行分类 决策树归纳的算法 : 贪心算法 终止划分的条件 5.属性选择度量:三种度量,信息增益 阅读全文
posted @ 2019-05-15 16:05 WFiresun 阅读(103) 评论(0) 推荐(0)
6.挖掘关联规则

摘要:1.什么是关联规则挖掘 关联规则反映一个事物与其它事物之间的相互依存性和关联性 关联规则挖掘是在事务、关系数据库中的项集和对象中发现频繁模式、关联规则、相关性或者 因果结构。 频繁模式:数据库中频繁出现的项集 犀利 扞许怀孕孝顺 2.关联规则基本模型 支持度是一个概率值,是一个相对计数 项集的支持度 阅读全文
posted @ 2019-05-14 21:02 WFiresun 阅读(324) 评论(0) 推荐(0)
5.数据立方体计算与数据泛化

摘要:1.两种不同类别的数据挖掘方法 描述性挖掘: 数据泛化 预测性挖掘:分类、回归分析 2.数据立方体的物化 3.数据立方体、闭立方体、立方体外壳和和计算策略搭档大裆、、喜欢西幻 4.什么是概念描述 概念描述是一种数据泛化的形式,概念通常指数据的汇集 5.概念描述 vs OLAP 相似处: 数据泛化 对 阅读全文
posted @ 2019-05-14 17:15 WFiresun 阅读(506) 评论(0) 推荐(0)
4.数据挖掘的数据仓库与OLAP技术

摘要:1.什么是数据仓库 面向主题的、集成的、时变的、非易失的 2.数据仓库和异种DBMS 3.OLTP vs OLAP 4.为什么建立分离的数据仓库? 5.多维数据模型(数据仓库的概念建模)三类度量 4.典型的OLAP操作 5.数据仓库实现 数据方的有效计算、数据方计算 6.从数据仓库到数据挖掘 7.数 阅读全文
posted @ 2019-05-14 10:57 WFiresun 阅读(335) 评论(0) 推荐(0)
03数据预处理

摘要:数据预处理 1.为什么数据预处理 2.数据为什么脏 3.为什么数据预处理是重要的 4.数据质量 5.数据预处理的主要任务 6.数据预处理的形式 数据清理 1.如何处理缺失数据 2.如何处理噪音数据 数据集成 1.模式集成、冲突数据值、冗余数据 数据变换 规范化数据的方法 :最小-最大规范化、Z-sc 阅读全文
posted @ 2019-05-01 21:46 WFiresun 阅读(182) 评论(0) 推荐(0)
02Data

摘要:1.数据从何而来 2.数据对象和属性类型 数据集合的类型 结构数据的重要特征 数据对象 属性 属性类型 数据属性的类型 离散 vs.连续属性 3.数据的(基本)统计描述 分布度量 代数度量 整体度量 度量数据的中心趋势 对称/偏斜数据 4.数据可视化 5.数据的相似性和相异性、邻近度 数据矩阵和相异 阅读全文
posted @ 2019-05-01 19:17 WFiresun 阅读(101) 评论(0) 推荐(0)
01数据挖掘引言

摘要:1.为什么不用传统的数据分析? 2.KDD过程的步骤 3.数据挖掘和商务智能 4.数据挖掘功能 5,数据挖掘分类 6,OLAP挖掘与数据仓库的集成 7.数据挖掘查询语言 调性(元语言) 阅读全文
posted @ 2019-04-30 16:27 WFiresun 阅读(125) 评论(0) 推荐(0)

博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3