07 2018 档案
简单排序(冒泡排序,插入排序,选择排序)
摘要:简单排序(冒泡排序,插入排序,选择排序)这些算法思想是比较简单的,执行速度也相对慢一些,不过,在某些情况下比那些复杂算法实际上还要好一些,比如,对于小规模的文件以及基本有序的文件,插入算法能比快速排序算法...
阅读全文
Azkaban启动web--javax.net.ssl.SSLException: Unrecognized SSL message, plaintext connection? at sun.se
摘要:javax.net.ssl.SSLException: Unrecognized SSL message, plaintext connection? at sun.sejavax.net.ssl.SSLException: Unrecognized SSL mes...
阅读全文
Azkaban工作流调度器
摘要:Azkaban工作流调度器 在Hadoop领域常用的工作流调度系统 Oozie,Azkaban,Cascading,Hamake等等。 性能对比: 安装:创建...
阅读全文
hive -- 自定义函数和Transform
摘要:hive -- 自定义函数和Transform UDF操作单行数据, UDAF:聚合函数,接受多行数据,并产生一个输出数据行 UDTF:操作单个数据使用udf方法:第一种: add...
阅读全文
hive -- 分区,分桶(创建,修改,删除)
摘要:hive -- 分区,分桶(创建,修改,删除)分区: 静态创建分区: 1. 数据:john doe 10000.0mary smith 8000.0todd jones 7000.0boss ma...
阅读全文
hive -- 协同过滤sql语句
摘要:hive -- 协同过滤sql语句数据:*.3g.qq.com|腾讯应用宝|应用商店*.91rb.com|91手机助手|应用商店*.app.qq.com|腾讯应用宝|应用商店*.haina...
阅读全文
Hive - - 分组求最大,最小(加行键)
摘要:Hive - - 分组求最大,最小(加行键)数据:1325927 陕西 汉中 084 08491325928 陕西 汉中 084 08491325930 陕西 延安 084 08421325931 陕西 延安 0...
阅读全文
hive的排序,分組练习
摘要:hive的排序,分組练习数据:添加表和插入数据(数据在Linux本地中)create table if not exists tab1( IP string, S...
阅读全文
Hive 外部表的练习(多表关联查询,以及分组,子查询)
摘要:Hive 外部表的练习hive创建库和表操作 hive加载数据,4种发放 1.数据放在Linux创建表结构 进行加载 2.先定义表结构、将一个查询select语句...
阅读全文
FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(me
摘要:FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:For direct MetaStore DB conn...
阅读全文
MapRdeuce&Yarn的工作机制(YarnChild是什么)
摘要:MapRdeuce&Yarn的工作机制一幅图解决你所有的困惑那天在集群中跑一个MapReduce的程序时,在机器上jps了一下发现了每台机器中有好多个YarnChild。困惑什么时Ya...
阅读全文
海量日志采集Flume(HA)
摘要:海量日志采集Flume(HA)1.介绍: Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume...
阅读全文
MapRedcue的demo(协同过滤)
摘要:MapRedcue的演示(协同过滤)做一个关于电影推荐。你于你好友之间的浏览电影以及电影评分的推荐的协同过滤。百度百科: 协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来...
阅读全文
浙公网安备 33010602011771号