随笔分类 -  python / 爬虫

摘要:网络爬虫之实战 正则表达式(Re)库入门 正则表达式的概念 正则表达式(Regular Expression):用来简洁表达一组字符串的方式。 正则表达式的优点:简洁!正则表达式表达的是一组字符串的特征。 'P' 'PY' 'PYYY' ... #正则表达式为:PY+,表示P后面跟着若干个Y #若一 阅读全文
posted @ 2021-04-27 15:51 黑衣の甘铃儿 阅读(109) 评论(0) 推荐(0)
摘要:网络爬虫之提取 Beautiful Soup库入门 Beautiful Soup库的安装 同样在shell或者cmd中使用pip install beautifulsoup4就可以完成它的安装,正如其名,这个库的作用是把各种各样的格式的文本像煲汤一样处理好。 beautiful soup库的测试 i 阅读全文
posted @ 2021-04-20 21:06 黑衣の甘铃儿 阅读(145) 评论(0) 推荐(0)
摘要:网络爬虫之规则 requests库入门 requests的get方法 r = requests.get(url) 构建一个request对象向服务器请求资源,返回一个包含服务器资源的response对象。 requests.get(url, parm, *kwags) url:网页的url链接 pa 阅读全文
posted @ 2021-04-19 18:52 黑衣の甘铃儿 阅读(199) 评论(0) 推荐(0)