06 2018 档案
摘要:re库的主要功能函数: 】 re.search(pattern,string,flag=0) pattern: 正则表达式的字符串或原生字符串表 string :待匹配字符串 flags :正则表达式使用时的控制标记 re.match(),re,findall(),re.finditer()接收的参
阅读全文
摘要:信息标记的三种形式: 1 XML 2 JSON 3 YAML 实列:提取HTML中所有URL链接 find_all(name,attrs,recursive,string,**kwargs) 1.name: 对标签名称的检索字符串。 2.attrs :对标签属性值的检索字符串,可标注属性检索。 3.
阅读全文
摘要:学习网站:中国大学MOOC 网址:https://www.icourse163.org/ 首先安装BeautifulSoup, 这个不多说了。。。 安装小测: demo是老师提供的一个测试网址。 BeautifulSoup对应一个HTML/XML文档的全部内容 BeautifulSoup可以通过标签
阅读全文
摘要:学习网站: 中国大学MOOC 网址: https://www.icourse163.org/ 用requests库的get()反法会返回一个response对象。 可能会出现的异常: r=requests.get(url) r.raise_for_status()在方法内部判断r.status_co
阅读全文

浙公网安备 33010602011771号