爬虫 - 随笔分类 - 兔子翻书

爬虫库知识总结

摘要：注意事项： 1 对于爬虫的每一步都要考虑到可能出现的错误，增加代码的可靠性 2 爬虫需要分析后再写代码，保证网页在有一定的修改后依然能正确的运行 3 要增加代理保证爬虫不被限制 4 在有移动端的情况下，最好去模拟手机去爬取移动端爬取步骤 1 获取网页内容：getHTMLText() 2 提取信息到阅读全文

posted @ 2021-05-30 20:05 兔子翻书阅读(66) 评论(0) 推荐(0)

爬虫模版&代理

摘要：普通请求 #r.request.headers 查看请求信息 import requests url='https://api.airtable.com/v0/appU9QT7BUOev35GR/iDM?maxRecords=3&view=Grid%20view' try: kv={'user-ag 阅读全文

posted @ 2021-05-30 20:04 兔子翻书阅读(109) 评论(0) 推荐(0)

爬各大电商平台

摘要：根据搜索爬天猫、京东、当当、孔夫子的书籍信息天猫 import requests from bs4 import BeautifulSoup import bs4 proxies = { 'http':'<http://117.135.153.10:80>' } headers = {'User- 阅读全文

posted @ 2021-05-30 20:03 兔子翻书阅读(132) 评论(0) 推荐(0)

Loading

MYJ's Blog

一个人只有付出，才会珍惜他所得到的

随笔分类 - 爬虫