2019年6月30日

信息标记的三种方式、比较及其提取方式

摘要: 1、信息的标记 标记后的信息可形成信息组织结构,增加了信息维度 标记后的信息可用于通信、存储或展示 标记后的结构与信息一样具有重要价值 标记后的信息更利于程序理解和运用 2、HTML的信息标记 HTML是www的信息组织方式。 HTML是通过预定义的<>....</>标签形式组织不同类型的信息 3、 阅读全文

posted @ 2019-06-30 22:07 喜欢世界的宇宙 阅读(948) 评论(0) 推荐(0)

基于bs4库的HTML内容遍历方法

摘要: 1、HTML基本格式(树形结构) 2、标签树的下行遍历 遍历儿子节点: 遍历子孙节点 3、标签树的上行遍历(soup的父节点是空的) 4、标签树的平行遍历 标签树的平行遍历条件: 是发生在同一个父节点下的各节点之间 遍历后续节点: 遍历前续节点: 阅读全文

posted @ 2019-06-30 17:02 喜欢世界的宇宙 阅读(853) 评论(0) 推荐(0)

BeautifulSoup库的简单实用

摘要: 1、BeautifulSoup库的简单理解 打开一个简单的html文件(每一对尖括号形成一个标签,标签之间有上下之间的关系,形成了标签树) <html> <body> <p class="title">....</p> </body> </html> BeautifulSoup库是解析、遍历、维护“ 阅读全文

posted @ 2019-06-30 16:26 喜欢世界的宇宙 阅读(259) 评论(0) 推荐(0)

导航