Loading

摘要: python : 3.6 lxml : 4.2.1 代码在上面。 简单说一说: requests配合xpath来抓网站数据的时候,不像selenium+xpath。 selenium有 find_element find_elements,区别是带S ,查找第一个元素,和查找所有元素。 reques 阅读全文
posted @ 2018-04-18 23:14 上官飞鸿 阅读(4943) 评论(0) 推荐(0)
摘要: 最近在抓取一个页面表格时发现,用firefox提取的xpath,不能用,仔细分析后,发现是提取的xpath多了一个tbody标签。在xpath路径中删掉这段就好了。 last_A5='/html/body/div[1]/table/tbody/tr/td/table[2]/tbody/tr[2]/t 阅读全文
posted @ 2018-04-18 06:12 上官飞鸿 阅读(637) 评论(0) 推荐(0)