xpath 解析 resp.text table 去表头，保存为 csv

from lxml import etree

# 在函数外面打开一个文件
f = open('data.csv', mode='w', encoding='utf-8')

tree = etree.HTML(resp.text)
# 查看页面源代码，找到唯一的
tr_list = tree.xpath("//table[@class='hq_table']/tr")[1:]  # 拿到所有的tr  不要表头方法1 [1:]做个切片
# tr_list = tree.xpath("//table[@class='hq_table']/tr[position()>1]")  # xpath 位置是从1开始的 不要表头方法2 [position()>1]
for tr in tr_list:
    td_texts = tr.xpath("./td/text()")  # 找到 tr 下面 td 下面所有的文本
    # print(td_texts)
    s = ",".join(td_texts)    # 把列表变成 csv 格式，用逗号拼接，变成字符串
    f.write(s)
    f.write("\n")        # "\n" 换行

posted @ 2023-07-09 18:44 严永富阅读(13) 评论(0) 收藏举报

刷新页面返回顶部

yanyongfu

xpath 解析 resp.text table 去表头，保存为 csv

公告