06 2018 档案

摘要:re库的主要功能函数: 】 re.search(pattern,string,flag=0) pattern: 正则表达式的字符串或原生字符串表 string :待匹配字符串 flags :正则表达式使用时的控制标记 re.match(),re,findall(),re.finditer()接收的参 阅读全文
posted @ 2018-06-28 23:24 cherro 阅读(141) 评论(0) 推荐(0)
摘要:信息标记的三种形式: 1 XML 2 JSON 3 YAML 实列:提取HTML中所有URL链接 find_all(name,attrs,recursive,string,**kwargs) 1.name: 对标签名称的检索字符串。 2.attrs :对标签属性值的检索字符串,可标注属性检索。 3. 阅读全文
posted @ 2018-06-27 22:36 cherro 阅读(321) 评论(0) 推荐(0)
摘要:学习网站:中国大学MOOC 网址:https://www.icourse163.org/ 首先安装BeautifulSoup, 这个不多说了。。。 安装小测: demo是老师提供的一个测试网址。 BeautifulSoup对应一个HTML/XML文档的全部内容 BeautifulSoup可以通过标签 阅读全文
posted @ 2018-06-24 23:18 cherro 阅读(152) 评论(0) 推荐(0)
摘要:学习网站: 中国大学MOOC 网址: https://www.icourse163.org/ 用requests库的get()反法会返回一个response对象。 可能会出现的异常: r=requests.get(url) r.raise_for_status()在方法内部判断r.status_co 阅读全文
posted @ 2018-06-23 23:41 cherro 阅读(687) 评论(0) 推荐(0)