【Hive】解析json字符串

简介:

get_json_object(string json_string, string path)

说明:

  1. 第一个参数填写json对象变量
  2. 第二个参数使用$表示json变量标识,然后用 . 或 [] 读取对象或数组;如果输入的json字符串无效,那么返回NULL。
  3. 每次只能返回一个数据项。

举例: 

data 为 test表中的字段,数据结构如下:

data =
{
 "store":
        {
         "fruit":[{"weight":8,"type":"apple"}, {"weight":9,"type":"pear"}],  
         "bicycle":{"price":19.95,"color":"red"}
         }, 
 "email":"amy@only_for_json_udf_test.net", 
 "owner":"amy" 
}

1.get单层值

hive> select get_json_object(data, '$.owner') from test;
结果:amy

2.get多层值.

hive> select get_json_object(data, '$.store.bicycle.price') from test;
结果:19.95

3.get数组值[]

hive> select get_json_object(data, '$.store.fruit[0]') from test;
结果:{"weight":8,"type":"apple"}

explode

explode 就是将hive一行中复杂的array或者map结构拆分成多行。

demo:

select ordernumber, get_json_object(concat('{',deviceId,'}'),'$.deviceInfo.deviceId') from table lateral view explode(split(substr(get_json_object(message,'$.data.YN031.results'),3,length(get_json_object(message,'$.data.YN031.results')) -4),'\\},\\{'))b1 as deviceId  where ; 

 

 

posted @ 2019-11-01 14:08  sowhat1412  阅读(487)  评论(0编辑  收藏  举报