摘要: xpath是一门在xml文档中查找信息的语言。xpath可以用来在xml文档中对元素和属性进行遍历。 在xpath中,有7中类型的节点,元素,属性,文本,命名空间,处理指令,注释及根节点。 节点 首先看下面例子: 上面的节点例子: 父:在上面的例子里,book是title,author,year,p 阅读全文
posted @ 2019-04-18 14:13 噼里巴啦 阅读(8482) 评论(0) 推荐(1) 编辑
摘要: 爬虫的一般分为四步,第二个步骤就是对爬取的数据进行解析。 python爬虫一般使用三种解析方式,一正则表达式,二xpath,三BeautifulSoup。 这篇博客主要记录下正则表达式的使用。 正则表达式 . 匹配除“\n”之外的任何单个字符。 * 匹配前面的子表达式零次或者多次。 + 匹配前面的子 阅读全文
posted @ 2019-04-18 12:52 噼里巴啦 阅读(1118) 评论(0) 推荐(0) 编辑