维度模型数据仓库(四)- 实现xml文件转换成数据表格式

 前面已经讲到了kettle的初始数据以及定时数据加载的sql以及kettle实现方式,这一节将聊聊xml转换成数据表格式数据。

  用Get date from XML组件加载数据至kettle。以如下XML文件为列:

  

  下面通过示例来展示如何使用该步骤,源 xml 文件内容如下:

<?xml version="1.0" encoding="UTF-8"?>
<result>
<genre>
<choice name="bm">1</choice>
<choice name="xm">张三</choice>
<choice name="xb">男</choice>
<choice name="csrq">19810101</choice>
<choice name="gmsfhm">37000000000001</choice>
<choice name="sg">178</choice>
</genre>
<genre>
<choice name="bm">2</choice>
<choice name="xm">李四</choice>
<choice name="xb">女</choice>
<choice name="csrq">19900101</choice>
<choice name="gmsfhm">37000000000002</choice>
<choice name="sg">185</choice>
</genre>
</result>

 

解析成数据表的格式数据如下:

 

spoon转换:

 

 

 

 

实现一个稍微复杂一点的XML数据转换:

<?xml version="1.0"?>

<timeseries>

<measurementyear="2000">

<!-- value ofitem named A in 2000 is 8.5 -->

<itemname="A">8.5</item>

<itemname="B">9.8</item>

</measurement>

<measurementyear="2001">

<itemname="A">12.2</item>

<itemname="B">9.4</item>

</measurement>

<measurementyear="2002">

<itemname="A">11.1</item>

<itemname="B">7.2</item>

</measurement>

</timeseries>

 

转换成格式如:

 

posted @ 2016-03-25 18:21  霍丽  阅读(285)  评论(0)    收藏  举报