python - 随笔分类 - 你我之间

python爬虫入门

摘要："知乎专栏" 获取整个网页的内容加入bs4 bs4是一个非常好的解析网页的库。先看bs4里面最常用的几个BeautifulSoup对象的方法。主要是通过HTML的标签和标签里面的参数来定位，然后用特定方法提取数据。这里提取教职员工的人员链接和姓名。存储阅读全文

posted @ 2017-02-11 20:43 你我之间阅读(181) 评论(0) 推荐(0)

下载百度贴吧图片

摘要：使用正则表达式使用BeautifulSoup coding: utf 8 import urllib from bs4 import BeautifulSoup def get_content(url): ''' 获取网页内容 ''' html = urllib.urlopen(url) cont 阅读全文

posted @ 2016-10-29 22:05 你我之间阅读(263) 评论(0) 推荐(0)

模仿浏览器访问网页

摘要：基于python2 阅读全文

posted @ 2016-10-28 17:58 你我之间阅读(389) 评论(0) 推荐(0)

urlretrieve

摘要：基于python3 阅读全文

posted @ 2016-10-26 08:08 你我之间阅读(152) 评论(0) 推荐(0)

Web Spider 01

摘要：基于python 3 基本应用简单登录阅读全文

posted @ 2016-09-12 12:16 你我之间阅读(118) 评论(0) 推荐(0)

白开水

淡淡的白开水

随笔分类 - python

公告