摘要:
导读:Hive是基于Hadoop的数据管理系统,作为分析人员的即时分析工具和ETL等工作的执行引擎,对于如今的大数据管理与分析、处理有着非常大的意义。GeoIP是一套IP映射库系统,它定时更新,并且提供了各种语言的API,非常适合在做地域相关数据分析时的一个数据源。Hive是基于Hadoop的数据管理系统,作为分析人员的即时分析工具和ETL等工作的执行引擎,对于如今的大数据管理与分析、处理有着非常大的意义。GeoIP是一套IP映射库系统,它定时更新,并且提供了各种语言的API,非常适合在做地域相关数据分析时的一个数据源。UDF是Hive提供的用户自定义函数的接口,通过实现它可以扩展Hive目前 阅读全文
posted @ 2013-08-12 17:53
茄子_2008
阅读(2934)
评论(0)
推荐(0)
摘要:
1、编写函数[java] view plaincopyprint?packagecom.example.hive.udf;importorg.apache.hadoop.hive.ql.exec.UDF;importorg.apache.hadoop.io.Text;publicfinalclassLowerCaseextendsUDF{publicTextevaluate(finalTexts){if(s==null){returnnull;}returnnewText(s.toString().toLowerCase());}}package com.example.hive.udf;im 阅读全文
posted @ 2013-08-12 17:39
茄子_2008
阅读(10125)
评论(0)
推荐(2)
浙公网安备 33010602011771号