摘要:
网址:豆瓣电影 (douban.com) 和豆瓣读书类似,需要对爬虫的headers进行处理。 import requests import re for i in range(0,2): j = i*20 url = 'https://movie.douban.com/j/search_subje 阅读全文
摘要:
网址:畅销榜_正版电子书在线阅读_百度阅读 (baidu.com) 根据页数,提取网址,查看其变化,进行爬取。 import requests import re for i in range(0,10): j = i*20 url = 'https://yuedu.baidu.com/rank/h 阅读全文