2017 年 1月随笔档案 - George_sz

初识ganglia

摘要：本文地址：http://www.cnblogs.com/qiaoyihang/ 一、Ganglia是什么？Ganglia主要用来解决什么样的问题？ ganglia是一个可扩展的分布式监控系统，用于监控和显示分布式集群节点的状态信息，比如CPU、内存、磁盘利用率、I/O负载、网络流量情况等方面的数据，阅读全文

posted @ 2017-01-18 17:13 George_sz 阅读(848) 评论(0) 推荐(0)

HDFS各个进程存储在磁盘上的数据含义和注意事项

摘要：本文地址：http://www.cnblogs.com/qiaoyihang/p/6293402.html (一)Namenode的目录结构 HDFS进行初次格式化之后将会在$dfs.namenode.name.dir/current目录下生成一系列文件： VERSION 文件的内容是一些HDFS的阅读全文

posted @ 2017-01-17 15:49 George_sz 阅读(2805) 评论(0) 推荐(0)

初识ambari

摘要：本文地址：http://www.cnblogs.com/qiaoyihang/p/6290467.html 引用：http://blog.csdn.net/yeruby/article/details/51167868 Ambari简介 ambari是一个拥有集群自动化安装，中心化管理，集群监控，报阅读全文

posted @ 2017-01-17 10:51 George_sz 阅读(2223) 评论(0) 推荐(0)

MySQL Split 函数

摘要：本文地址：http://www.cnblogs.com/qiaoyihang/p/6270165.html mysql 本身并没有 split 函数，但是，我们实现累死功能的自定义函数是非常简单的创建函数的语法用户自定义函数是拓展mysql函数的一种方式，它用起来和mysql本身自带的函数没有什阅读全文

posted @ 2017-01-10 17:24 George_sz 阅读(118732) 评论(2) 推荐(1)

行存储和列存储

摘要：本文地址：http://www.cnblogs.com/qiaoyihang/p/6262806.html 传统的行式数据库将一个个完整的数据行存储在数据页中。这种方式在大数据量查询的时候会出现以下问题 1、在没有索引的情况下，会把一行全部查出来，查询会使用大量IO 2、虽然建立索引和物化视图可以可阅读全文

posted @ 2017-01-08 21:42 George_sz 阅读(20705) 评论(0) 推荐(3)

Hbase安装和错误

摘要：本文地址：http://www.cnblogs.com/qiaoyihang/p/6259893.html 集群规划情况：搭建步骤：第一步：配置conf/regionservers 第二部：配置新增 backup-masters 第三部配置 hbase-site.xml 第四部：配置hbas 阅读全文

posted @ 2017-01-07 17:47 George_sz 阅读(569) 评论(0) 推荐(0)

mysql 常用自定义函数解析

摘要：本文地址：http://www.cnblogs.com/qiaoyihang/p/6250684.html 阅读全文

posted @ 2017-01-05 19:32 George_sz 阅读(2918) 评论(1) 推荐(1)

mysq l错误Table ‘./mysql/proc’ is marked as crashed and should be repaired

摘要：续上一篇，解决了上一篇中的问题后，启动成功，但是在数据库中操作会存在一些问题，一些操作报一下异常：解决方案：阅读全文

posted @ 2017-01-05 10:55 George_sz 阅读(1099) 评论(0) 推荐(0)

MySql提示:The server quit without updating PID file(…)失败

摘要：一般有一下集中可能 1.可能是/usr/local/mysql/data/rekfan.pid文件没有写的权限解决方法：给予权限，执行 “chown -R mysql:mysql /var/data” “chmod -R 755 /usr/local/mysql/data” 然后重新启动mysql 阅读全文

posted @ 2017-01-05 10:50 George_sz 阅读(240) 评论(0) 推荐(0)

mysql 自定义函数

摘要：原文：http://www.cnblogs.com/zhangminghui/p/4113160.html 引言 MySQL本身提供了内置函数，这些函数的存在给我们日常的开发和数据操作带来了很大的便利，比如我前面提到过的聚合函数SUM()、AVG()以及日期时间函数等等，可是我们总会出现其他的需求：阅读全文

posted @ 2017-01-04 20:57 George_sz 阅读(631) 评论(0) 推荐(0)

hive 调优总结

摘要：一、join优化做join之前对数据进行预处理，减少参加join的数据量，把数据量少的表放入内存中，制作map端的join 应该将条目少的表/子查询放在 Join 操作符的左边。原因是在 Join 操作的 Reduce 阶段，位于 Join 操作符左边的表的内容会被加载进内存，将条目少的表放在左边阅读全文

posted @ 2017-01-04 14:49 George_sz 阅读(628) 评论(0) 推荐(0)

初识hive

摘要：由facebook 开源用以帮用户解决海量数据etl，构建于hadoop的数据仓库。使用hql作为查询接口使用hdfs作为底层存储使用mr作为执行层 1、为什么使用hive？ 1）在大数据的挑战下，传统的数据库不堪负重 2）使用mr编程繁琐 3）人员成本考虑 2、hive和hbase的区别阅读全文

posted @ 2017-01-04 10:04 George_sz 阅读(443) 评论(0) 推荐(0)

深入学习HBase架构原理

摘要：HBase定义 HBase 是一个高可靠、高性能、面向列、可伸缩的分布式存储系统，利用Hbase技术可在廉价PC Server上搭建大规模结构化存储集群。 HBase 是Google Bigtable 的开源实现，与Google Bigtable 利用GFS作为其文件存储系统类似， HBase 利阅读全文

posted @ 2017-01-03 21:25 George_sz 阅读(9648) 评论(4) 推荐(7)

学而不思则罔，思而不学则殆

一个人的奋斗......

01 2017 档案

公告