摘要: #那数据源代码 #提取和解析数据 import requests from lxml import etree url ="https://shijiazhuang.zbj.com/search/f/?type=new&kw=saas" resp=requests.get(url) html=etr 阅读全文
posted @ 2022-04-26 11:31 凋零_( 阅读(148) 评论(0) 推荐(0) 编辑
摘要: #xpath是在xml文档中搜索内容的一门语言 #html是xml的子集 xml = """ <book> <id>1</id> <name>野花遍地⾹</name> <price>1.23</price> <nick>臭⾖腐</nick> <author> <nick id="10086">周⼤强 阅读全文
posted @ 2022-04-26 11:07 凋零_( 阅读(28) 评论(0) 推荐(0) 编辑
摘要: #html标签的筛选 #拿到页面源代码 #使用bs4进行解析 import time import requests import csv from bs4 import BeautifulSoup header= { "User-Agent": "Mozilla/5.0 (Windows NT 1 阅读全文
posted @ 2022-04-26 10:01 凋零_( 阅读(27) 评论(0) 推荐(0) 编辑