摘要: 1:strip()方法,去除字符串开头或者结尾的空格 >>> a = " a b c " >>> a.strip() 'a b c' 2:lstrip()方法,去除字符串开头的空格 >>> a = " a b c " >>> a.lstrip() 'a b c ' 3:rstrip()方法,去除字符 阅读全文
posted @ 2019-08-01 23:14 Jervey 阅读(17216) 评论(0) 推荐(0)
摘要: 使用XPath XPath,全称XML Path Language,即XML路径语言,它是一门在xml文档中查找信息的语言。它最初是用来搜寻XML文档的,但是它同样使用于HTML文档的搜索。 所以在做爬虫时,我们完全可以使用XPath来做相应的信息抽取。 XPath 常用规则 表 达 式 描 述 n 阅读全文
posted @ 2019-08-01 21:41 Jervey 阅读(280) 评论(0) 推荐(0)
摘要: 主流的匹配字符有两种 [\u4e00-\u9fa5]和[\u2E80-\u9FFF],后者范围更广,包括了日韩地区的汉字 阅读全文
posted @ 2019-08-01 08:39 Jervey 阅读(4535) 评论(0) 推荐(0)