上一页 1 ··· 326 327 328 329 330 331 332 333 334 ··· 385 下一页
摘要: 象限法 例: 多维法 假设法 指数法 二八法 对比法 ] 阅读全文
posted @ 2020-07-20 19:10 秋华 阅读(426) 评论(0) 推荐(0)
摘要: 1 结构化 例如;线下销售的产品销售额度下降原因分析 或者这样 使用工具思 维 导 图 2 公式化 3 业务化 阅读全文
posted @ 2020-07-20 18:57 秋华 阅读(909) 评论(0) 推荐(0)
摘要: 1 概述 Zookeeper 是一个开源的分布式的,为分布式应用提供协调服务的 Apache 项目。 2 特点 3 数据结构 4 应用场景 统一命名服务 统一配置管理 统一集群管理 服务器动态上下线 软负载均衡 阅读全文
posted @ 2020-07-20 15:52 秋华 阅读(150) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2020-07-20 15:02 秋华 阅读(131) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2020-07-19 23:55 秋华 阅读(263) 评论(0) 推荐(0)
摘要: 数据清洗案例实操-复杂解析版 1.需求 对Web访问日志中的各字段识别切分,去除日志中不合法的记录。根据清洗规则,输出过滤后的数据。 (1)输入数据 (2)期望输出数据 都是合法的数据 2.实现代码 (1)定义一个bean,用来记录日志数据中的各数据字段 package com.atguigu.ma 阅读全文
posted @ 2020-07-19 20:57 秋华 阅读(352) 评论(0) 推荐(0)
摘要: 数据清洗案例实操-简单解析版 在运行核心业务MapReduce程序之前,往往要先对数据进行清洗,清理掉不符合用户要求的数据。清理的过程往往只需要运行Mapper程序,不需要运行Reduce程序。 1.需求 去除日志中字段长度小于等于11的日志。 (1)输入数据 (2)期望输出数据 每行字段长度都大于 阅读全文
posted @ 2020-07-19 20:49 秋华 阅读(822) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-07-19 20:36 秋华 阅读(151) 评论(0) 推荐(0)
摘要: 1 Reduce Join Map端的主要工作:为来自不同表或文件的key/value对,打标签以区别不同来源的记录。然后用连接字段作为key,其余部分和新加的标志作为value,最后进行输出。 Reduce端的主要工作:在Reduce端以连接字段作为key的分组已经完成,我们只需要在每一个分组当中 阅读全文
posted @ 2020-07-19 20:33 秋华 阅读(193) 评论(0) 推荐(0)
摘要: 1 OutputFormat接口实现类 2 自定义OutputFormat 3 自定义OutputFormat案例实操 1.需求 过滤输入的log日志,包含atguigu的网站输出到e:/atguigu.log,不包含atguigu的网站输出到e:/other.log。 (1)输入数据 (2)期望输 阅读全文
posted @ 2020-07-19 20:27 秋华 阅读(276) 评论(0) 推荐(0)
上一页 1 ··· 326 327 328 329 330 331 332 333 334 ··· 385 下一页