爬取猪八戒网信息基于xpath

#那数据源代码
#提取和解析数据
import requests
from lxml import etree
url ="https://shijiazhuang.zbj.com/search/f/?type=new&kw=saas"
resp=requests.get(url)
html=etree.HTML(resp.text)
divs=html.xpath('/html/body/div[6]/div/div/div[2]/div[5]/div[1]/div') #拿到每一个服务商的div
for div in divs:
    name=div.xpath('./div/div/a[1]/div[1]/p/text()')[1]
    price=div.xpath('./div/div/a[2]/div[2]/div[1]/span[1]/text()')[0]
    num = div.xpath('./div/div/a[2]/div[2]/div[1]/span[2]/text()')[0]
    dis = div.xpath('./div/div/a[2]/div[2]/div[2]/p/text()')[0]
    print(name,price,num,dis)

posted @ 2022-04-26 11:31 凋零_( 阅读(202) 评论(0) 收藏举报

刷新页面返回顶部

你的撒凋零呦

爬取猪八戒网信息基于xpath

公告