woodyle

博客园 首页 新随笔 联系 订阅 管理

07 2015 档案

摘要:1、 BeautifulSoup是一个很好用的Python写的一个HTML/XML的解析器,它可以处理不规范标记并生成剖析树(parse tree)。Beautifulsoup可以对便签Object进行操作。tag (对应html中的标签)tag.attrs (以字典形式返回tag的所有属性)可以直 阅读全文
posted @ 2015-07-13 13:55 woodyle 阅读(166) 评论(0) 推荐(0)

摘要:1、正则表达式 \w 匹配任何字类字符,包括下划线。与“[A-Za-z0-9_]”等效。 \W 与任何非单词字符匹配。与“[^A-Za-z0-9_]”等效。 + 一次或多次匹配前面的字符或子表达式。例如,“zo+”与“zo”和“zoo”匹配,但与“z”不匹配。+ 等效于 {1,}。[xyz] 字符集 阅读全文
posted @ 2015-07-05 23:12 woodyle 阅读(241) 评论(0) 推荐(0)