学习2:百度翻译
#UA:User-Agent(请求载体的身份识别)
#UA监测:门户网站的服务器会监测对应的请求的载体身份标识,若为浏览器则为正常请求,
#反之,为不正常请求,服务端可能拒绝该请求。
#UA伪装:让爬虫对应的请求载体身份标识伪装成某一款浏览器
import requests
import json
#1.指定url
post_url = 'https://fanyi.baidu.com/sug'
#2.进行UA伪装
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'
}
#3.post请求参数处理
word = input('Enter a word:')
data = {
'kw':word
}
#4.请求发送
response = requests.post(url=post_url, data=data, headers=headers)
#获取响应数据:json()方法返回的是obj(如果确认响应数据是json类型,才可以用json)
dic_obj = response.json()
#5.持久化存储
fileName = word + '.json'
fp = open(fileName, 'w', encoding='utf-8')
json.dump(dic_obj, fp=fp, ensure_ascii=False)
print('爬取结束!!!')
参考:
https://www.bilibili.com/video/BV1ha4y1H7sx?p=8
 
                    
                     
                    
                 
                    
                
 
                
            
         
         浙公网安备 33010602011771号
浙公网安备 33010602011771号