xml模块

xml是一种文档的格式
xml模块的作用:
是帮我们解析xml格式的文档
xml 可扩展标记语言
所有内容都已标签的形式存在
标签由三部分组成
<tag 属性='属性值'>文本</tag>
1.标签名称
2.标签属性 可以是多个 必须放到引号里面
3.文本
如下所示:
<root>
  <person name="阿狗" age="20">
    hello 你好
    <sub>111</sub>
    <person>1212121</person>
    </person>

  <person name="阿猫" age="19">
    hello 你不好
  </person>
</root>

import xml.etree.ElementTree as ET #相当于类
# 创建一个树的对象
tree =ET.ElementTree() #实例化
#解析这个文档
tree.parse('test.xml')
#获取根标签
root=tree.getroot()

person_tags = root.findall('person')
for tag in person_tags:
  print(tag)
  print(tag.tag,tag.attrib,tag.text)

person_tag = root.find('person')
print(person_tag)
print(person_tag.tag,person_tag.attrib,person_tag.text)

person_tag = root.iter('person')
for tag in person_tag:
  print(tag)
  print(tag.tag,tag.attrib,tag.text)

学习xml的重点就是 学习如何在文档中找你所需要的标签
有三种方式获取需要的标签
  1.iter   全文查找
  2.find    返回第一个 是在当前标签的子级标签中查找,只要名称匹配就能找到
  3.findall    返回所有 是在当前标签的子级标签中查找,只要名称匹配就能找到
找到标签后获取三个属性来获取内容
  tag 名字
  attrib 属性
  text 文本

posted @ 2018-12-25 14:54  Zhuang_Z  阅读(133)  评论(0)    收藏  举报