2020 年 10月 31 日随笔档案 - JWEY

2020年10月31日

摘要：正则爬取糗事百科图片 import requests import re import os dir_name = './糗图' if not os.path.exists(dir_name): os.mkdir(dir_name) if name == 'main': headers = { 'U 阅读全文

posted @ 2020-10-31 23:00 JWEY 阅读(74) 评论(0) 推荐(0)

爬虫Day03

摘要：数据解析聚焦爬虫爬取页面中指定的页面内容编码流程指定url 发起请求获取响应数据数据解析持久化存储数据解析分类正则 bs4 xpath 数据解析原理概述解析的局部的文本内容都会在标签之间或者标签对应的属性中进行存储进行指定标签的定位标签或者标签对应的属性中存储的数据进行提取( 阅读全文

posted @ 2020-10-31 22:57 JWEY 阅读(67) 评论(0) 推荐(0)

爬虫Day02

摘要： import requests import json if name == 'main': url = 'http://scxk.nmpa.gov.cn:81/xk/itownet/portalAction.do?method=getXkzsList' headers = { 'User-Agen 阅读全文

posted @ 2020-10-31 22:54 JWEY 阅读(63) 评论(0) 推荐(0)

JWEY

公告