随笔分类 - python / 爬虫
摘要:网络爬虫之实战 正则表达式(Re)库入门 正则表达式的概念 正则表达式(Regular Expression):用来简洁表达一组字符串的方式。 正则表达式的优点:简洁!正则表达式表达的是一组字符串的特征。 'P' 'PY' 'PYYY' ... #正则表达式为:PY+,表示P后面跟着若干个Y #若一
阅读全文
摘要:网络爬虫之提取 Beautiful Soup库入门 Beautiful Soup库的安装 同样在shell或者cmd中使用pip install beautifulsoup4就可以完成它的安装,正如其名,这个库的作用是把各种各样的格式的文本像煲汤一样处理好。 beautiful soup库的测试 i
阅读全文
摘要:网络爬虫之规则 requests库入门 requests的get方法 r = requests.get(url) 构建一个request对象向服务器请求资源,返回一个包含服务器资源的response对象。 requests.get(url, parm, *kwags) url:网页的url链接 pa
阅读全文

浙公网安备 33010602011771号