摘要:
一、普通图形验证码 1、相关库安装(MAC) 导入tesserocr报错和解决办法 事例测试(方法一比方法二精确度好) 如果图像识破不出来就需要先转灰度再二值化处理 处理前: 处理后: 二、极验滑动验证码(Selenium、ChromeDriver、Chrome) 三、点触验证码 四、微博宫格验证码 阅读全文
posted @ 2018-11-30 22:11
起航追梦人
阅读(330)
评论(0)
推荐(0)
摘要:
需求:爬取淘宝iPad前100页商品 分析:分析网页是动态渲染的无法用普通的方法爬取 方法: 1、查看网页源码发现g_page_config这个包含了商品信息,用正则可以爬取,具体方法省略 2、可见即可爬:selenium+chrome(PhantomJS) 阅读全文
posted @ 2018-11-30 21:54
起航追梦人
阅读(315)
评论(0)
推荐(0)

浙公网安备 33010602011771号