学习4:肯德基网页

页面数据如下:

 

 

import requests
import json

#1.指定url
url = 'http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword'
word = input('enter a word:')
param = {
'cname':'',
'pid':'',
'keyword':word, #注意,word不能加单引号,否则保存的文件是错误的
'pageIndex': '1',
'pageSize': '10',
}

#2.进行UA伪装
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'
}

#3.请求发送
response = requests.post(url=url, params=param, headers=headers)
#获取响应数据:json()方法返回的是obj(如果确认响应数据是json类型,才可以用json)
list_data = response.json()

#4.持久化存储
fileName = word + '.json'
fp = open(fileName,'w', encoding='utf-8')
json.dump(list_data, fp=fp, ensure_ascii=False)

print('爬取结束!!!')

 

 

参考:

https://www.bilibili.com/video/BV1ha4y1H7sx?p=10

posted @ 2022-07-25 13:02  萧六弟  阅读(134)  评论(0)    收藏  举报