摘要: 机器学习算法day04_Logistic回归分类算法及应用 课程大纲 Logistic回归分类算法原理 Logistic回归分类算法概述 Logistic回归分类算法思想 Logistic回归分类算法分析 算法要点 Logistic回归分类算法案例 案例需求 Python实现 Sigmoid函数 返 阅读全文
posted @ 2020-10-03 18:34 十一vs十一 阅读(220) 评论(0) 推荐(0)
摘要: 机器学习算法day04_决策树分类算法及应用 课程大纲 决策树分类算法原理 决策树算法概述 决策树算法思想 决策树构造 算法要点 决策树分类算法案例 案例需求 Python实现 决策树的持久化保存 课程目标: 1、理解决策树算法的核心思想 2、理解决策树算法的代码实现 3、掌握决策树算法的应用步骤: 阅读全文
posted @ 2020-10-03 18:33 十一vs十一 阅读(291) 评论(0) 推荐(0)
摘要: 机器学习算法day03_协同过滤推荐算法及应用 课程大纲 协同过滤推荐算法原理 协同过滤推荐算法概述 协同过滤推荐算法思想 协同过滤推荐算法分析 协同过滤推荐算法要点 协同过滤推荐算法实现 协同过滤推荐算法案例 案例需求 数据规整 参数设定 用Scikili机器学习算法库实现 算法检验 实现推荐 协 阅读全文
posted @ 2020-10-03 18:31 十一vs十一 阅读(303) 评论(0) 推荐(0)
摘要: 机器学习算法day02_Kmeans聚类算法及应用 课程大纲 Kmeans聚类算法原理 Kmeans聚类算法概述 Kmeans聚类算法图示 Kmeans聚类算法要点 Kmeans聚类算法案例 需求 用Numpy手动实现 用Scikili机器学习算法库实现 Kmeans聚类算法补充 算法缺点 改良思路 阅读全文
posted @ 2020-10-03 18:29 十一vs十一 阅读(307) 评论(0) 推荐(0)
摘要: 机器学习算法day02_贝叶斯分类算法及应用 课程大纲 朴素贝叶斯算法原理 Bayes算法概述 Bayes算法思想 Bayes算法要点 朴素贝叶斯算法案例1 需求 Python实现 朴素贝叶斯算法案例2 需求 Python实现 课程目标: 1、理解朴素贝叶斯算法的核心思想 2、理解朴素贝叶斯算法的代 阅读全文
posted @ 2020-10-03 18:28 十一vs十一 阅读(350) 评论(0) 推荐(0)
摘要: 机器学习算法day02_KNN分类算法及应用 课程大纲 KNN分类算法原理 KNN概述 KNN算法图示 KNN算法要点 KNN算法不足之处 KNN分类算法Python实战 KNN简单数据分类实践 KNN实现手写数字识别 KNN算法补充 KNN算法中k值的选取 类别判定 如何选择合适的衡量距离 训练样 阅读全文
posted @ 2020-10-03 18:27 十一vs十一 阅读(397) 评论(0) 推荐(0)
摘要: python数据类型详解 目录 1、字符串 2、布尔类型 3、整数 4、浮点数 5、数字 6、列表 7、元组 8、字典 9、日期 1、字符串 1.1、如何在Python中使用字符串 a、使用单引号(') 用单引号括起来表示字符串,例如: str='this is string'; print str 阅读全文
posted @ 2020-10-03 18:24 十一vs十一 阅读(212) 评论(0) 推荐(0)
摘要: 流量运营项目说明 求职定位:至少是团队的Leader 一、项目关联方 1、甲方——移动运营商(移动电信联通等) 1、乙方——亚信科技(地铁人民大学站,中电信息大厦,去年搬到软件园二期)/东方网信/神州泰岳/思特奇….. 二、项目开发周期 1、项目启动时间:2011年3月份正式立项 2、项目开发周期: 阅读全文
posted @ 2020-10-03 18:23 十一vs十一 阅读(279) 评论(0) 推荐(0)
摘要: 一、概述 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。 当所有维表都直接连接到“ 事实表”上时,整个图解就像星星一样,故将该模型称为星型模型,如图 1 。 星型架构 阅读全文
posted @ 2020-10-03 18:21 十一vs十一 阅读(284) 评论(0) 推荐(0)
摘要: 数据仓库命名规范 目录 1. 概述 3 2. 数据仓库命名规范 4 2.1. 命名规范 4 2.1.1. 表属性规范 4 2.1.2. 索引 9 2.1.3. 视图 10 2.1.4. 物化视图 10 2.1.5. 存储过程 10 2.1.6. 触发器 10 2.1.7. 函数 10 2.1.8. 阅读全文
posted @ 2020-10-03 18:19 十一vs十一 阅读(2183) 评论(0) 推荐(0)
摘要: 数据仓库建模备课资料 目录 1 什么是数据模型 1 2 为什么需要数据仓库模型 2 3 如何建设数据仓库模型 3 3.1 数据仓库数据模型架构 3 3.2 数据仓库建模阶段划分 4 3.4 数据仓库建模方法 6 4 数据仓库建模案例 9 4.1 零售行业案例分析 9 1 什么是数据模型 数据模型是抽 阅读全文
posted @ 2020-10-03 18:18 十一vs十一 阅读(215) 评论(0) 推荐(0)
摘要: 数据仓库简介 1 什么是数据仓库 数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。 2  阅读全文
posted @ 2020-10-03 18:15 十一vs十一 阅读(192) 评论(0) 推荐(0)
摘要: #创建分桶表create table stu_buck(sno int,sname string,sex string,sage int,sdept string)clustered by(sno) sorted by(sno DESC)into 4 bucketsrow format delimi 阅读全文
posted @ 2020-10-03 18:12 十一vs十一 阅读(149) 评论(0) 推荐(0)
摘要: create table t_access_times(username string,month string,salary int)row format delimited fields terminated by ','; load data local inpath '/home/hadoo 阅读全文
posted @ 2020-10-03 18:11 十一vs十一 阅读(151) 评论(0) 推荐(0)
摘要: 课程目标 v 理解网站点击流数据分析的业务背景 v 理解网站点击流数据分析中常用分析指标的业务含义 v 掌握网站点击流数据分析系统的技术架构 v 掌握网站点击流数据分析系统中各环节的技术实现 v 能独立设计完成一个初步的网站点击流数据分析系统 网站点击流数据分析,业务知识,推荐书籍: 《网站分析实战 阅读全文
posted @ 2020-10-03 18:10 十一vs十一 阅读(256) 评论(0) 推荐(0)
摘要: hadoop2.0已经发布了稳定版本了,增加了很多特性,比如HDFS HA、YARN等。最新的hadoop-2.6.4又增加了YARN HA 注意:apache提供的hadoop-2.6.4的安装包是在32位操作系统编译的,因为hadoop依赖一些C++的本地库,所以如果在64位的操作上安装hado 阅读全文
posted @ 2020-10-03 18:09 十一vs十一 阅读(135) 评论(0) 推荐(0)
摘要: 课程大纲(辅助系统) 离线辅助系统 数据接入 Flume介绍 Flume组件 Flume实战案例 任务调度 调度器基础 市面上调度工具 Oozie的使用 Oozie的流程定义详解 数据导出 sqoop基础知识 sqoop实战及原理 Sqoop数据导入实战 Sqoop数据导出实战 Sqoop作业操作 阅读全文
posted @ 2020-10-03 18:07 十一vs十一 阅读(214) 评论(0) 推荐(0)
摘要: 目录 课程大纲(HIVE增强) 3 1. Hive基本概念 4 1.1 Hive简介 4 1.1.1 什么是Hive 4 1.1.2 为什么使用Hive 4 1.1.3 Hive的特点 4 1.2 Hive架构 5 1.2.1 架构图 5 1.2.2 基本组成 5 1.2.3 各组件的基本功能 5 阅读全文
posted @ 2020-10-03 18:05 十一vs十一 阅读(278) 评论(0) 推荐(0)
摘要: 课程大纲(HADOOP高可用机制) HA运作机制 什么是HA HADOOP如何实现HA HDFS-HA详解 HA集群搭建 目标: 掌握分布式系统中HA机制的思想 掌握HADOOP内置HA的运作机制 掌握HADOOP2.x的HA集群机制配置 1 Hadoop的HA机制 前言:正式引入HA机制是从had 阅读全文
posted @ 2020-10-03 18:02 十一vs十一 阅读(115) 评论(0) 推荐(0)