摘要:
正则爬取糗事百科图片 import requests import re import os dir_name = './糗图' if not os.path.exists(dir_name): os.mkdir(dir_name) if name == 'main': headers = { 'U 阅读全文
posted @ 2020-10-31 23:00
JWEY
阅读(74)
评论(0)
推荐(0)
摘要:
数据解析 聚焦爬虫 爬取页面中指定的页面内容 编码流程 指定url 发起请求 获取响应数据 数据解析 持久化存储 数据解析分类 正则 bs4 xpath 数据解析原理概述 解析的局部的文本内容都会在标签之间或者标签对应的属性中进行存储 进行指定标签的定位 标签或者标签对应的属性中存储的数据进行提取( 阅读全文
posted @ 2020-10-31 22:57
JWEY
阅读(67)
评论(0)
推荐(0)
摘要:
import requests import json if name == 'main': url = 'http://scxk.nmpa.gov.cn:81/xk/itownet/portalAction.do?method=getXkzsList' headers = { 'User-Agen 阅读全文
posted @ 2020-10-31 22:54
JWEY
阅读(63)
评论(0)
推荐(0)

浙公网安备 33010602011771号