摘要: 0. 常用匹配规则 ^ 匹配字符串的开头 $ 匹配字符串的结尾 [...] 匹配一组字符,比如 [abc] 表示匹配小写字母 a 或者 b 或者 c,[a-z] 表示匹配所有的小写字母,[0-3] 表示匹配数字 0,1,2,3 [^...] 匹配不在 []中的字符 . 匹配除了换行符以外的任意字符, 阅读全文
posted @ 2020-08-05 10:36 seniusen 阅读(145) 评论(0) 推荐(0) 编辑
摘要: 0. 安装及导入 安装 pip install beautifulsoup4 导入 from bs4 import BeautifulSoup 如果选择 lxml 解析器的话还需要安装 pip install lxml,这个解析器的优点是效率更高 1. 访问结构化数据 假设我们有下面这段 HTML 阅读全文
posted @ 2020-08-05 10:32 seniusen 阅读(124) 评论(0) 推荐(0) 编辑