摘要: pip下载路径D:\python\Lib\site-packages 阅读全文
posted @ 2020-09-24 22:52 _年少无知 阅读(171) 评论(0) 推荐(1)
摘要: “5+2 ” 结构 scrapy爬虫框架结构 engine 核心:控制所有模块之间的数据流,根据条件触发事件。 downloader:根据请求下载网页,不需要用户修改。 scheduler:所有爬取请求进行调度管理。不需要用户修改。 Downloader Middleware 目的:实施Engine 阅读全文
posted @ 2020-09-24 22:39 _年少无知 阅读(164) 评论(0) 推荐(0)
摘要: #CrowTaobaoPrice.py import requests import re def getHTMLText(url): try: r = requests.get(url, timeout=30) r.raise_for_status() r.encoding = r.apparen 阅读全文
posted @ 2020-09-24 14:55 _年少无知 阅读(154) 评论(0) 推荐(0)
摘要: regular expression (re) '一行正千言' eg: PY+ 代表有PY后面有无穷的Y的字符串。 **************************************** 通用的字符串表达框架 简洁表达一组字符串的表达式 针对字符串表达“简介”和特征思想的工具 判断某字符串 阅读全文
posted @ 2020-09-24 12:21 _年少无知 阅读(271) 评论(0) 推荐(0)