resp.text table 去表头 保存为 csv

from lxml import etree

# 在函数外面打开一个文件
f = open('data.csv', mode='w', encoding='utf-8')

tree = etree.HTML(resp.text)
# 查看页面源代码,找到唯一的
tr_list = tree.xpath("//table[@class='hq_table']/tr")[1:] # 拿到所有的tr 不要表头方法1 [1:]做个切片
# tr_list = tree.xpath("//table[@class='hq_table']/tr[position()>1]") # xpath 位置是从1开始的 不要表头方法2 [position()>1]
for tr in tr_list:
td_texts = tr.xpath("./td/text()") # 找到 tr 下面 td 下面所有的文本
# print(td_texts)
s = ",".join(td_texts) # 把列表变成 csv 格式,用逗号拼接,变成字符串
f.write(s)
f.write("\n") # "\n" 换行
posted @ 2023-07-09 18:39  严永富  阅读(8)  评论(0)    收藏  举报