摘要: hive多分区写入 sql 多分区写入 set mapred.max.split.size=256000000; set hive.exec.dynamic.partition.mode=nonstrict; set hive.exec.max.dynamic.partitions=800; set 阅读全文
posted @ 2019-09-18 10:15 大数据-大道至简 阅读(4165) 评论(0) 推荐(0)
摘要: 清理hdfs小文件shell脚本 sh !/bin/bash echo " " echo "BASH_VERSION: $BASH_VERSION" echo "参数说明: " echo "从外部只传递零个参数时,遍历字典,删除 hdfs 对应日期下的文件目录" echo "从外部只传递一个参数时, 阅读全文
posted @ 2019-09-18 10:11 大数据-大道至简 阅读(858) 评论(0) 推荐(0)
摘要: 大数据应用建设开源工具 作业调度工具 Hera 分布式任务调度系统 "hera项目地址" hera 分布式任务调度系统 大数据任务调度系统 任务调度 (数据部门专用) hera分布式任务调度系统是根据前阿里开源调度系统(zeus)进行的二次开发,其中zeus大概在2014年开源,开源后却并未进行维护 阅读全文
posted @ 2019-09-18 10:10 大数据-大道至简 阅读(406) 评论(0) 推荐(0)
摘要: 中国工信.三大运营商号段 正则匹配 正则匹配测试 运营商号码段维表 表结构 初始化数据 init date: 2019 09 16 阅读全文
posted @ 2019-09-18 10:09 大数据-大道至简 阅读(1506) 评论(0) 推荐(0)
摘要: sparkf:spark-sql替换hive查询引擎 阅读全文
posted @ 2019-09-18 10:08 大数据-大道至简 阅读(1472) 评论(0) 推荐(0)
摘要: hivef:hive 执行 sql 文件 shell !/bin/bash yesterday= today= tomarrow= echo "从外部只传递两个参数时,第一个参数必须是 hive sql 文件,第二个必须是YYYY MM DD格式的日期!" echo "从外部只传递一个参数时,第一个 阅读全文
posted @ 2019-09-18 10:07 大数据-大道至简 阅读(2005) 评论(0) 推荐(0)
摘要: hivef:hive 执行 sql 文件 阅读全文
posted @ 2019-09-18 10:05 大数据-大道至简 阅读(160) 评论(0) 推荐(0)
知识共享许可协议
本作品采用知识共享署名-非商业性使用-禁止演绎 3.0 未本地化版本许可协议进行许可。