xpath 解析 resp.text table 去表头,保存为 csv
from lxml import etree
# 在函数外面打开一个文件
f = open('data.csv', mode='w', encoding='utf-8')
tree = etree.HTML(resp.text)
# 查看页面源代码,找到唯一的
tr_list = tree.xpath("//table[@class='hq_table']/tr")[1:] # 拿到所有的tr 不要表头方法1 [1:]做个切片
# tr_list = tree.xpath("//table[@class='hq_table']/tr[position()>1]") # xpath 位置是从1开始的 不要表头方法2 [position()>1]
for tr in tr_list:
td_texts = tr.xpath("./td/text()") # 找到 tr 下面 td 下面所有的文本
# print(td_texts)
s = ",".join(td_texts) # 把列表变成 csv 格式,用逗号拼接,变成字符串
f.write(s)
f.write("\n") # "\n" 换行

浙公网安备 33010602011771号