摘要:
css选择器分三类,作用都是找到元素加样式的 一、属性选择器 什么是属性? 属性是相对于标签而言的。像class、style等等都是属性。就可以根据属性的值找到元素 所谓属性选择器就是指根据指定名称的属性的值来查找元素。 E[attribute]:表示存在attr属性即可。E是Element元素的意 阅读全文
posted @ 2019-03-09 23:37
张仁国
阅读(133)
评论(0)
推荐(0)
摘要:
知道了正则表达式的相关用法,但是一旦正则表达式写的有问题,得到的可能就不是我们想要的结果了。而且对于一个网页来说,都有一定的特殊结构和层级关系,而且有很多节点都有id或class来做区分,所以借助它们的结构和属性来提取也可以。 本随笔内容就来介绍一个强大的解析工作Beautiful Soup,它借助 阅读全文
posted @ 2019-03-09 21:32
张仁国
阅读(370)
评论(0)
推荐(0)
摘要:
一、使用XPath XPath ,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言。它最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索。 所以在爬虫时,我们完全可以使用XPath来做相应的信息提取。本次随笔中,我们就介绍XPath的基本用法 阅读全文
posted @ 2019-03-09 15:16
张仁国
阅读(745)
评论(0)
推荐(0)

浙公网安备 33010602011771号