2018 年 4月 18 日随笔档案 - 上官飞鸿

2018年4月18日

摘要： python ： 3.6 lxml ： 4.2.1 代码在上面。简单说一说： requests配合xpath来抓网站数据的时候，不像selenium+xpath。 selenium有 find_element find_elements，区别是带S ，查找第一个元素，和查找所有元素。 reques 阅读全文

posted @ 2018-04-18 23:14 上官飞鸿阅读(4943) 评论(0) 推荐(0)

玩linux就是不断的踩坑，踩坑。最近的坑。xpath firefox兼容问题，抓取表格。

摘要：最近在抓取一个页面表格时发现，用firefox提取的xpath，不能用，仔细分析后，发现是提取的xpath多了一个tbody标签。在xpath路径中删掉这段就好了。 last_A5='/html/body/div[1]/table/tbody/tr/td/table[2]/tbody/tr[2]/t 阅读全文

posted @ 2018-04-18 06:12 上官飞鸿阅读(637) 评论(0) 推荐(0)

Loading

上官飞鸿

公告