摘要:
#那数据源代码 #提取和解析数据 import requests from lxml import etree url ="https://shijiazhuang.zbj.com/search/f/?type=new&kw=saas" resp=requests.get(url) html=etr 阅读全文
摘要:
#xpath是在xml文档中搜索内容的一门语言 #html是xml的子集 xml = """ <book> <id>1</id> <name>野花遍地⾹</name> <price>1.23</price> <nick>臭⾖腐</nick> <author> <nick id="10086">周⼤强 阅读全文
摘要:
#html标签的筛选 #拿到页面源代码 #使用bs4进行解析 import time import requests import csv from bs4 import BeautifulSoup header= { "User-Agent": "Mozilla/5.0 (Windows NT 1 阅读全文