10 2017 档案
摘要:一 。参考文档参考 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL二。 数据库操作》》创建数据库 环境参考 http://blog.csdn.net/liaomin416100...
阅读全文
摘要:一 。hive简介 hive是基于hadoop文件系统的大数据分析工具,能够轻松实现数据汇总 点对点查询 大批量数据分析等 使用传统的SQL语法 提供了UDF 用户自定义函数来分析统计数据。hive的数据组成: 数据库(Databases) 类似于 my...
阅读全文
摘要:一。 MAP REDUCE执行原理 MapReduce主要分为三个阶段 Map阶段 Shuffle阶段 Reduce阶段 1》Map阶段:Hadoop Map/Reduce框架为每一个InputSplit产生一个map任务,而每个InputSplit是由该作...
阅读全文
摘要:一。 yarn架构 mapreduce从 0.2.3之后 进行了重构, 发布新的mapreduce 版本v2, 也可以称为 yarn 引入了资源调度的概念 之前的JobTracker 被拆分成了 Resouce Manager和ApplicationMaster...
阅读全文
摘要:一。 freemarker简介 在互联网软件内容网站中 一般首页的访问量大,为了提供首页的访问效率,一般 首页的内容以及其中的新闻等信息都可以实现html静态化 浏览器访问时 设置浏览器的缓存策略和生成静态页面的周期一致 可以使访问效率大大提升 同时配合cdn处...
阅读全文
摘要:一 。Federation简介和原理 之前的ha和集群都是单namenode对外提供服务 明显当用户量大时 会出现服务宕机问题 就算standby服务器激活也会导致崩溃为了水平的拓展namnode服务 federation提供了多个namnode 这些...
阅读全文
摘要:一 。QJM简介和原理 hadoop集群环境 namenode元数据保存在一台机器中 存在单点故障 传统的高可用解决方案 至少有一台从机 用于备份主机数据,同一时间只有主机对外提供服务,如果主机宕机 从机能够自动接管主机服务,从机为了同步主机的数据 必须定期同步主...
阅读全文
摘要:一。hdfs原理和架构 Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throug...
阅读全文
摘要:一。 zuul介绍 路由是微服务架构的不可或缺的一部分。例如:”/” 可能映射到你应用主页,/api/users映射到用户服务,/api/shop映射到购物服务。Zuul。Zuul是Netflix出品的一个基于JVM路由和服务端的负载均衡器 当一个UI应用想要...
阅读全文
摘要:一。断路器介绍 分布式系统中 服务和服务之间调用必然存在多层,调用过程必然涉及到网络 cpu 内存的占用 假设订阅者调用发布者 发布者服务出现宕机等 订阅者如果不能及时发现监控到错误 所有的请求依然会被请求到失败的发布者服务,失败的请求可能需要连接网络 开启线程 失...
阅读全文
摘要:一 。客户端介绍 在springcloud中发布的服务一般为http服务 使用http服务客户端即可调用 最底层的http协议是使用它tcp协议实现 清晰理解http协议请求响应模型可以使用Socket来进行请求 这种方式开发成本太大,java.net包提供了 Ht...
阅读全文