摘要: .find_all(name,attrs,recursive,string,**kwargs)返回一个列表类型,存储查找的结果。name:对标签名称的检索字符串attrs:对标签属性值得检索字符串,可标注属性检索recursive:是对子孙全部检索,默... 阅读全文
posted @ 2018-11-20 22:49 yorkmass 阅读(351) 评论(0) 推荐(0)
摘要: 信息提取的一般方法方法一:完整解析信息的标记形式,再提取关键信息。XML JSON YAML需要标记解析器 例如:bs4库的标签树遍历优点:信息解析准确缺点:提取过程繁琐,速度慢 方法二:无视标记形式,直接搜索关键信息。搜索对信息的文本查找函数即可优点... 阅读全文
posted @ 2018-11-20 21:21 yorkmass 阅读(540) 评论(0) 推荐(0)
摘要: HTML就不做介绍了,太熟悉了,就是用各种标签进行标记XML以标签为主,来构建信息表达信息用于Internet上的信息交互与传递和Html非常接近,是Html的扩展XML学习教程:http://www.runoob.com/xml/xml-tutori... 阅读全文
posted @ 2018-11-20 10:14 yorkmass 阅读(245) 评论(0) 推荐(0)