上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 30 下一页
摘要: 前面介绍了sqoop1.4.6的 如何将mysql数据导入Hadoop之Sqoop安装,下面就介绍两者间的数据互通的简单使用命令。 显示mysql数据库的信息,一般sqoop安装测试用 显示数据库里所有表: mysql导入到hdfs中 sqoop ##sqoop命令import ##表示导入--co 阅读全文
posted @ 2017-06-26 08:42 欢醉 阅读(4874) 评论(0) 推荐(0) 编辑
摘要: Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库 阅读全文
posted @ 2017-06-23 09:00 欢醉 阅读(5866) 评论(3) 推荐(2) 编辑
摘要: 这里主要介绍几种常见的日志的source来源,包括监控文件型,监控文件内容增量,TCP和HTTP。 Spool类型 用于监控指定目录内数据变更,若有新文件,则将新文件内数据读取上传 在教你一步搭建Flume分布式日志系统最后有介绍此案例 Exec EXEC执行一个给定的命令获得输出的源,如果要使用t 阅读全文
posted @ 2017-06-06 09:32 欢醉 阅读(13382) 评论(0) 推荐(0) 编辑
摘要: 在前篇几十条业务线日志系统如何收集处理?中已经介绍了Flume的众多应用场景,那此篇中先介绍如何搭建单机版日志系统。 环境 CentOS7.0 Java1.8 下载 官网下载 http://flume.apache.org/download.html 当前最新版 apache-flume-1.7.0 阅读全文
posted @ 2017-05-31 08:48 欢醉 阅读(3677) 评论(5) 推荐(2) 编辑
摘要: 在互联网迅猛发展的今天 各大厂发挥十八般武艺的收集用户的各种信息,甚至包括点击的位置,我们也经常发现自己刚搜完一个东西,再打开网页时每个小广告都会出现与之相关联的商品或信息,在感叹智能的同时不惊想 什么时候泄露的行踪。 许多公司的业务平台每天都会产生大量的日志数据。收集业务日志数据,供离线和在线的分 阅读全文
posted @ 2017-05-26 08:53 欢醉 阅读(8515) 评论(6) 推荐(7) 编辑
摘要: Hadoop的编程可以是在Linux环境或Winows环境中,在此以Windows环境为示例,以Eclipse工具为主(也可以用IDEA)。网上也有很多开发的文章,在此也参考他们的内容只作简单的介绍和要点总结。 Hadoop是一个强大的并行框架,它允许任务在其分布式集群上并行处理。但是编写、调试Ha 阅读全文
posted @ 2017-05-17 08:43 欢醉 阅读(3089) 评论(0) 推荐(2) 编辑
摘要: 经过一系列的前期环境准备,现在可以开始Hadoop的安装了,在这里去apache官网下载2.7.3的版本 http://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz 不需要下载最新的3.0版本 阅读全文
posted @ 2017-05-10 08:56 欢醉 阅读(1448) 评论(0) 推荐(2) 编辑
摘要: 由于Hadoop需要运行在Linux环境中,而且是分布式的,因此个人学习只能装虚拟机,本文都以VMware Workstation为准,安装CentOS7,具体的安装此处不作过多介绍,只作需要用到的知识介绍。 VMware的安装,装好一个虚拟机后利用复制虚拟机的方式创建后面几个虚拟机,省时省力,需要 阅读全文
posted @ 2017-05-08 08:42 欢醉 阅读(823) 评论(0) 推荐(2) 编辑
摘要: 系统操作 #使用shutdown命令马上重启系统[root@H32 ~]# shutdown –r now #使用shutdown命令马上关闭系统[root@H32 ~]# shutdown –h now #使用shutdown命令设置在15分钟以后自动重启系统[root@H32 ~]# shutd 阅读全文
posted @ 2017-05-04 08:50 欢醉 阅读(477) 评论(0) 推荐(0) 编辑
摘要: 在互联网的世界中数据都是以TB、PB的数量级来增加的,特别是像BAT光每天的日志文件一个盘都不够,更何况是还要基于这些数据进行分析挖掘,更甚者还要实时进行数据分析,学习,如双十一淘宝的交易量的实时展示。 大数据什么叫大?4个特征: 体量化 Volume,就是量大。 多样化 Variety,可能是结构 阅读全文
posted @ 2017-05-03 08:54 欢醉 阅读(6730) 评论(3) 推荐(2) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 30 下一页