07 2018 档案
摘要:(一) 分析页面 访问今日头条页面(https://www.toutiao.com/)在输入框中输入要搜索的关键字,搜索出的页面点击图集。要爬取的就是这里的所有图集。 查看页面的URL可以发现这是一个POST请求,然后我们就检查页面找到POST请求包,进行分析。 这个就是POST请求服务器返回的re
阅读全文
摘要:# coding=utf-8 import requests from lxml import etree ''' 爬取猫眼网站TOP100的电影数据并写为json格式文件 ''' # 通过起始url获取要爬取url列表 def get_url(url): url_list = [url] for num in range(10, 91, 10): data =...
阅读全文
摘要:python,编码方式,encode,decode
阅读全文

浙公网安备 33010602011771号