Python读取常用的数据文件

1、CSV

  • csv文件:指将数据列用逗号分隔的文件,文件的扩展名是.csv。另一种数据文件叫制表符数据文件,指数据列之间分隔符是制表符。

注:用excel表格打开csv文件格式如上图

# 导入csv库
import csv

# 1、读取csv数据文件获得一个列表
csv_list = open(file="data/csv_data.csv", mode="r")
reader_list = csv.reader(csv_list)

# 遍历列表数据
for row in reader_list:
    print(row)

结果:

['id', 'name', 'age', 'addr']
['1', 'tom', '24', 'BeiJing']
['2', 'jack', '23', 'BeiJing']
['3', 'bob', '32', 'BeiJing']
['4', 'marry', '24', 'BeiJing']
['5', 'tony', '11', 'BeiJing']
['6', 'marthin', '53', 'BeiJing']
['7', 'jason', '22', 'ShangHai']
['8', 'keivn', '23', 'ShangHai']
['9', 'king', '42', 'ShangHai']
['10', 'fiona', '19', 'ShangHai']

 

2、JSON

  • json文件:每一条记录都像python中的字典,数据都有键-值对,用冒号(:)分隔,数据条目之间用逗号(,)分隔,首尾用花括号({})包围的数据结构。

注:json格式文件数据结构如上图所示

# 导入json库
import json

# 读取json文件获取json字符串对象
json_data = open(file="data/json_data.json", mode="r").read()
print(type(json_data))  # <class 'str'>

# 将json字符串转换json对象
json_obj = json.loads(json_data)
print(type(json_obj))  # <class 'dict'>

# 遍历文件
for item in json_obj['user']:
    print(item)

 结果:

{'id': 10, 'name': 'Tom', 'age': 22, 'addr': 'BeiJing'}
{'id': 11, 'name': 'Jack', 'age': 25, 'addr': 'ShangHai'}

 

3、XML

  • xml文件:使用标签和属性来保存数据。

注:xml格式文件数据结构如上图所示

# 导入xml相关的库
from xml.etree import ElementTree as ET

# 解析xml文件获取对象
tree = ET.parse(source="data/xml_data.xml")

# 获取根节点信息,通过根节点查找指定名称的子节点对象
root_ele = tree.getroot()
user_ele = root_ele.find('user')

# 获取遍历字节点的属性值
for i in user_ele:
    print(i.attrib['value'])

 

结果:

10
Tom
22
BeiJing

 

posted @ 2020-12-09 23:54  零下一度的微笑  阅读(586)  评论(0编辑  收藏  举报