java selenium爬取验证图片是否加载完成
摘要:爬虫任务里发现有部分图片没有加载完成就进行文件流上传,导致有一些图片是空白,需要判断一下: 首选获取image标签元素: WebElement image = driver.findElement(By.cssSelector("div#media_container > img")); boole
阅读全文
posted @
2017-06-26 14:17
断剑重铸之时
阅读(746)
推荐(0)
爬虫验证码破解任务
摘要:之前爬取的网站中有部分需要验证码才能点击下载图片,所以查阅了一些破解验证码相关的资料; 思路:先将验证码图片下载到临时文件中,再用工具去破解,然后将破解的验证码通过selenium模拟输入到文本中再模拟点击完成; 附上代码: //模拟点击免费下载 driver.findElement(By.id("
阅读全文
posted @
2017-06-20 17:51
断剑重铸之时
阅读(369)
推荐(0)
poi解析word文档转换成html(包括图片解析)
摘要:需求:将本地上传的word文档解析并放入数据库中 代码: import java.io.ByteArrayOutputStream;import java.io.File;import java.io.FileNotFoundException;import java.io.IOException;
阅读全文
posted @
2017-06-07 17:06
断剑重铸之时
阅读(1316)
推荐(0)