维度模型数据仓库(四)- 实现xml文件转换成数据表格式
前面已经讲到了kettle的初始数据以及定时数据加载的sql以及kettle实现方式,这一节将聊聊xml转换成数据表格式数据。
用Get date from XML组件加载数据至kettle。以如下XML文件为列:
下面通过示例来展示如何使用该步骤,源 xml 文件内容如下:
<?xml version="1.0" encoding="UTF-8"?>
<result>
<genre>
<choice name="bm">1</choice>
<choice name="xm">张三</choice>
<choice name="xb">男</choice>
<choice name="csrq">19810101</choice>
<choice name="gmsfhm">37000000000001</choice>
<choice name="sg">178</choice>
</genre>
<genre>
<choice name="bm">2</choice>
<choice name="xm">李四</choice>
<choice name="xb">女</choice>
<choice name="csrq">19900101</choice>
<choice name="gmsfhm">37000000000002</choice>
<choice name="sg">185</choice>
</genre>
</result>
解析成数据表的格式数据如下:

spoon转换:

实现一个稍微复杂一点的XML数据转换:
<?xml version="1.0"?>
<timeseries>
<measurementyear="2000">
<!-- value ofitem named A in 2000 is 8.5 -->
<itemname="A">8.5</item>
<itemname="B">9.8</item>
</measurement>
<measurementyear="2001">
<itemname="A">12.2</item>
<itemname="B">9.4</item>
</measurement>
<measurementyear="2002">
<itemname="A">11.1</item>
<itemname="B">7.2</item>
</measurement>
</timeseries>
转换成格式如:


浙公网安备 33010602011771号