随笔分类 -  python

摘要:"知乎专栏" 获取整个网页的内容 加入bs4 bs4是一个非常好的解析网页的库。先看bs4里面最常用的几个BeautifulSoup对象的方法。主要是通过HTML的标签和标签里面的参数来定位,然后用特定方法提取数据。 这里提取教职员工的人员链接和姓名。 存储 阅读全文
posted @ 2017-02-11 20:43 你我之间 阅读(181) 评论(0) 推荐(0)
摘要:使用正则表达式 使用BeautifulSoup coding: utf 8 import urllib from bs4 import BeautifulSoup def get_content(url): ''' 获取网页内容 ''' html = urllib.urlopen(url) cont 阅读全文
posted @ 2016-10-29 22:05 你我之间 阅读(263) 评论(0) 推荐(0)
摘要:基于python2 阅读全文
posted @ 2016-10-28 17:58 你我之间 阅读(389) 评论(0) 推荐(0)
摘要:基于python3 阅读全文
posted @ 2016-10-26 08:08 你我之间 阅读(152) 评论(0) 推荐(0)
摘要:基于python 3 基本应用 简单登录 阅读全文
posted @ 2016-09-12 12:16 你我之间 阅读(118) 评论(0) 推荐(0)