会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
yorkmass
I wanner be a nice coder
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
7
8
9
10
11
12
13
14
15
下一页
2018年11月26日
Scrapy爬虫框架的安装
摘要: 我们直接用pip安装Scrapy的话,会发生错误,提示构建twisted时安装失败,或者提示安装 Microsoftvisual c++14.0 的一个库。 运行pip install Scrapy时候提示Twisted安装失败所以我们就得按着提示,哪...
阅读全文
posted @ 2018-11-26 12:32 yorkmass
阅读(171)
评论(0)
推荐(0)
2018年11月25日
爬虫:股票数据定向爬虫
摘要: 功能描述*目标:获取上交所和深交所所有股票的名称和交易信息*输出:保存到文件中*技术路线:requests-bs4-re候选数据网站的选择:新浪股票:https://finance.sina.com.cn/stock/百度股票:https://gupi...
阅读全文
posted @ 2018-11-25 15:24 yorkmass
阅读(743)
评论(0)
推荐(0)
2018年11月24日
爬虫:淘宝商品信息定向爬虫
摘要: 功能描述目标:获取淘宝搜索页面的信息,提取其中的商品名称和价格。理解:淘宝的搜索接口 翻页的处理技术路线:requests-re准备,安排!我们先搜索:裙子,查看浏览器返回的链接信息起始页:https://s.taobao.com/...
阅读全文
posted @ 2018-11-24 21:12 yorkmass
阅读(1376)
评论(0)
推荐(0)
爬虫:Re库的贪婪匹配和最小匹配
摘要: 贪婪匹配Re库默认采用贪婪匹配,即输出匹配最长的子串。>>> import re>>> match=re.search(r'PY.*N','PYANBNCNDN')>>> match.group(0)'PYANBNCNDN'最小匹配如何输出最短的子串呢...
阅读全文
posted @ 2018-11-24 18:10 yorkmass
阅读(240)
评论(0)
推荐(0)
爬虫:Re库的match对象
摘要: Match对象的属性属性 说明 .string 待匹配的文本 .re 匹配时使用的pattern对象(正则表达式...
阅读全文
posted @ 2018-11-24 17:58 yorkmass
阅读(528)
评论(0)
推荐(0)
python爬虫学习笔记五:Re库的介绍和使用
摘要: Re库介绍Re库是Python的标准库,主要用于字符串匹配。调用方式:import re正则表达式的表示类型*raw string 类型(原生字符串类型):re库采用raw string类型表示正则表达式,表示为:r'text'例如:r'[1-9]\d...
阅读全文
posted @ 2018-11-24 17:02 yorkmass
阅读(741)
评论(0)
推荐(0)
把自己电脑做成web服务器+内网穿透并发布网页
摘要: 把自己电脑做成web服务器加内网穿透发布网站。前言:由于学校WiFi为内网ip,且WiFi 为动态ip 由于为动态IP,每次登陆都会换IP地址,所以建议网线连接或者一直开机不断网,否则每次开机都要重新设置。本方法采用内网穿透,将本机的IP地址映射到云服...
阅读全文
posted @ 2018-11-24 14:00 yorkmass
阅读(1493)
评论(0)
推荐(0)
2018年11月21日
爬虫:正则表达式
摘要: 正则表达式regular expression regex RE正则表达式是用来简洁表达一组字符串的表达式‘PY’ ‘PYY’ 'PYYY' 'PYYYY' 可表示为PY+'PY'开头 ,后续存在不多于10个字符后续字符不能是‘P’或‘Y’ ...
阅读全文
posted @ 2018-11-21 15:12 yorkmass
阅读(198)
评论(0)
推荐(0)
爬虫:中国大学排名定向爬虫实例
摘要: 实例最好大学排名http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html功能描述:输入大学排名URL链接输出:大学排名信息的屏幕输出(排名,大学名称,总分)技术路线:requests-bs4定向爬虫:仅...
阅读全文
posted @ 2018-11-21 08:29 yorkmass
阅读(521)
评论(0)
推荐(0)
2018年11月20日
爬虫:基于bs4库的html内容查找方法
摘要: .find_all(name,attrs,recursive,string,**kwargs)返回一个列表类型,存储查找的结果。name:对标签名称的检索字符串attrs:对标签属性值得检索字符串,可标注属性检索recursive:是对子孙全部检索,默...
阅读全文
posted @ 2018-11-20 22:49 yorkmass
阅读(351)
评论(0)
推荐(0)
上一页
1
···
7
8
9
10
11
12
13
14
15
下一页
公告