xpath & csv文件读写

原理：拿到网页源代码并且进行分析

关键词：etree .xpath a[@href="dapao"] a/@href text()

import requests,csv
from lxml import etree

resp = requests.get(url)
html=etree.HTML(resp.text)
divs=html.xpath('//*[@class="new-service-wrap"]/div')
#定位的是 包含所有数据元素的大框/div（要下面全部的div 每个div都成为一个对象）


 
for div in divs:  #相对对查找  ./
        price=div.xpath('./div/div/a[1]/div[2]/div[1]/span[1]/text()')[0].strip('¥') #去除多余字符  默认strip（）移除所有空白


resp.close()

拿标签文本

    <em style="width:80px;">2.00</em>
result2=tree.xpath('/html/body/ul/li[1]//em/text()')

筛选标签属性拿文本

tree.xpath('/html/body/ol/li/a[@href="dapao"]/text()')

拿标签里的属性值

i.xpath('./a/@href')
#相对查找
#结果都是列表

csv文件读写

f=open("csv/pig.csv", mode='w', encoding='utf-8')
csvwriter=csv.writer(f)  #创建一个写的对象

i=['1','2','3','4']
csvwriter.writerow(i)
f.close()

posted @ 2021-07-06 09:48 磕伴阅读(116) 评论(0) 收藏举报

刷新页面返回顶部

磕伴

xpath & csv文件读写

公告