xpath & csv文件读写
原理:拿到网页源代码并且进行分析
关键词:etree .xpath a[@href="dapao"] a/@href text()
import requests,csv from lxml import etree resp = requests.get(url) html=etree.HTML(resp.text) divs=html.xpath('//*[@class="new-service-wrap"]/div') #定位的是 包含所有数据元素的大框/div(要下面全部的div 每个div都成为一个对象) for div in divs: #相对对查找 ./ price=div.xpath('./div/div/a[1]/div[2]/div[1]/span[1]/text()')[0].strip('¥') #去除多余字符 默认strip()移除所有空白 resp.close()
拿标签文本
<em style="width:80px;">2.00</em> result2=tree.xpath('/html/body/ul/li[1]//em/text()')
筛选标签属性拿文本
tree.xpath('/html/body/ol/li/a[@href="dapao"]/text()')
拿标签里的属性值
i.xpath('./a/@href') #相对查找 #结果都是列表
csv文件读写
f=open("csv/pig.csv", mode='w', encoding='utf-8') csvwriter=csv.writer(f) #创建一个写的对象 i=['1','2','3','4'] csvwriter.writerow(i) f.close()

浙公网安备 33010602011771号