随笔分类 -  (5)Hadoop&Hive

Hive调用python脚本
摘要:python脚本如下: #!/bin/env python # -*- coding=utf-8 -*- import sys import datetime d_user = { "user1": "true", "user2": "true" } for line in sys.stdin: l 阅读全文

posted @ 2021-04-19 17:33 cfox 阅读(797) 评论(0) 推荐(0)

Hive语法手册
摘要:Order By、Cluster By 和 Distribute By的用法 阅读全文

posted @ 2015-09-02 16:04 cfox 阅读(1293) 评论(0) 推荐(0)

Hive一些参数设置
摘要:在使用union all的时候,系统资源足够的情况下,为了加快hive处理速度,可以设置如下参数实现并发执行  设置map reduce个数  设置任务名称  Hive文件合并     dfs.block.size   决定HDFS文件block数量的多少(文件个数),它会间接的影响Job Trac 阅读全文

posted @ 2014-07-16 18:43 cfox 阅读(22516) 评论(0) 推荐(1)

Hive命令学习
摘要:Hive的一些基本命令 阅读全文

posted @ 2013-10-30 11:28 cfox 阅读(366) 评论(0) 推荐(0)

Hadoop系统中的一些概念
摘要:Hadoop系统中的一些组件的作用 阅读全文

posted @ 2013-10-28 18:10 cfox 阅读(293) 评论(0) 推荐(0)

Hadoop系统命令
摘要:Hadoop系统的几个主要常用命令 阅读全文

posted @ 2013-10-28 16:04 cfox 阅读(198) 评论(0) 推荐(0)

ssh无密码登录设置
摘要:ssh无密码登录设置 阅读全文

posted @ 2013-10-25 18:14 cfox 阅读(300) 评论(0) 推荐(0)

导航