xpath & csv文件读写

原理:拿到网页源代码并且进行分析

关键词:etree     .xpath      a[@href="dapao"]      a/@href       text()

import requests,csv
from lxml import etree

resp = requests.get(url)
html=etree.HTML(resp.text)
divs=html.xpath('//*[@class="new-service-wrap"]/div')
#定位的是 包含所有数据元素的大框/div(要下面全部的div 每个div都成为一个对象)


 
for div in divs:  #相对对查找  ./
        price=div.xpath('./div/div/a[1]/div[2]/div[1]/span[1]/text()')[0].strip('¥') #去除多余字符  默认strip()移除所有空白


resp.close()
        

 拿标签文本

    <em style="width:80px;">2.00</em>
result2=tree.xpath('/html/body/ul/li[1]//em/text()') 

筛选标签属性拿文本

tree.xpath('/html/body/ol/li/a[@href="dapao"]/text()') 

拿标签里的属性值

i.xpath('./a/@href')
#相对查找
#结果都是列表

csv文件读写

f=open("csv/pig.csv", mode='w', encoding='utf-8')
csvwriter=csv.writer(f)  #创建一个写的对象

i=['1','2','3','4']
csvwriter.writerow(i)
f.close()

 

posted @ 2021-07-06 09:48  磕伴  阅读(110)  评论(0)    收藏  举报