摘要: TXT JSON json.loads(str)把字符串转为JSON对象 json.dumps(JSON, indent=2, ensure_ascii=False)把JSON对象转换为字符串 indent=2设置格式,2代表缩进字符数 ensure_ascii=False解决乱码 CSV CSV存 阅读全文
posted @ 2018-11-23 20:56 起航追梦人 阅读(151) 评论(0) 推荐(0)
摘要: 1、XPath:from lxml import etree 选取节点(所有节点:*) 属性匹配 html.xpath('节点名称[@属性名称="属性"]') html.xpath('节点名称[contains(@属性名称, "属性")]') 多属性匹配选一匹配 如:<p class="a b">. 阅读全文
posted @ 2018-11-23 20:15 起航追梦人 阅读(140) 评论(0) 推荐(0)
摘要: import re import requests def get_html(url): headers = { 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safar... 阅读全文
posted @ 2018-11-23 00:56 起航追梦人 阅读(544) 评论(0) 推荐(0)