摘要: Selenium+Tesseract-OCR智能识别验证码爬取网页数据 1.项目需求描述 通过订单号获取某系统内订单的详细数据,不需要账号密码的登录验证,但有图片验证码的动态识别,将获取到的数据存到数据库。 2.整体思路 1.通过Selenium技术,无窗口模式打开浏览器 2.在输入框中动态输入订单号 3.将图片验证码截图保存到本地 4.通过Tesseract-OCR技 阅读全文
posted @ 2021-09-27 09:55 大数据智工厂 阅读(360) 评论(0) 推荐(0) 编辑
摘要: 在使用Linux系统的时候,通常需要安装许多软件,Linux系统通常安装软件有源码包安装(文件格式:.tar.gz 或.tar.bz2;安装过程:解压、环境检查、编译和安装)、Rpm包安装(文件格式:.rpm)、二进制安装(文件格式:.tar.gz /.tgz /.bz2;安装过程:解压即可)和Yu 阅读全文
posted @ 2020-10-26 15:20 大数据智工厂 阅读(303) 评论(0) 推荐(0) 编辑
摘要: 下面是Linux系统一些常见的操作命令的使用情况介绍。 1.文件相关命令 1) 文件创建 ① 创建单个文件 touch test.txt ② 创建多个文件 touch test1.txt test2.txt touch {test1.txt,test2.txt} 2) 文件删除 ① 删除文件时,系统 阅读全文
posted @ 2020-09-16 19:39 大数据智工厂 阅读(388) 评论(0) 推荐(1) 编辑
摘要: 在IDEA里面直接下载插件,提示Plugin CheckStyle-IDEA was not installed: Cannot download 'https://plugins.jetbrains.com/pluginManager/?action=download&id=CheckStyle- 阅读全文
posted @ 2019-08-14 17:08 大数据智工厂 阅读(10821) 评论(0) 推荐(0) 编辑
摘要: 1.DEV Development environment 开发环境,用于开发者调试使用 2.FAT Feature Acceptance Test environment 功能验收测试环境,用于软件测试者测试使用 3.UAT User Acceptance Test environment 用户验 阅读全文
posted @ 2019-07-25 09:58 大数据智工厂 阅读(9961) 评论(0) 推荐(6) 编辑
摘要: 微服务架构之SpringCloud介绍 1.什么是微服务 2.SpringCloud架构 3.SpringCloud组件 4.微服务相关技术 Docker Jenkins 阅读全文
posted @ 2019-07-22 10:00 大数据智工厂 阅读(667) 评论(0) 推荐(0) 编辑
摘要: 1.trimEnd:截取末尾几个长度的字符串 import scala.collection.mutable.ArrayBuffer val a = ArrayBuffer[Int]() a+=(1,2,3,4,5) a.trimEnd(3) a res15: scala.collection.mu 阅读全文
posted @ 2019-07-16 23:38 大数据智工厂 阅读(201) 评论(0) 推荐(0) 编辑
摘要: 如果将一个变量声明为lazy,则只有在第一次使用该变量时,变量对应的表达式才会起作用。 例如:对于特别耗时的的计算操作特别有用,如打开文件IO,网络IO等。 阅读全文
posted @ 2019-07-16 22:45 大数据智工厂 阅读(244) 评论(0) 推荐(0) 编辑
摘要: 使用递归函数实现累加: head指的是:取nums的第一个数值,如:1 tail指的是:取nums除第一个数值之外的后面的数值,如:2,3,4,5 阅读全文
posted @ 2019-07-16 22:20 大数据智工厂 阅读(307) 评论(0) 推荐(0) 编辑
摘要: 这主要是maven编译时编码问题导致的。 解决办法: 1.在IDEA的File里面打开Settings。 2.找到Runner,在VM Options输入-DarchetypeCatalog=internal -Dfile.encoding=GBK,就可以解决maven编译、打包时中文乱码的问题。 阅读全文
posted @ 2019-07-12 11:54 大数据智工厂 阅读(3490) 评论(0) 推荐(0) 编辑
摘要: 功能描述:Oracle sqlplus中退格键、DEL键、上下左右键无法使用乱码 1.安装readline-8.0 ①下载readline-8.0.tar.gz文件,百度网盘下载路径: https://pan.baidu.com/s/17doxBx4cwOtiMHu5i9TESQ,提取码:hizy 阅读全文
posted @ 2019-05-05 11:45 大数据智工厂 阅读(529) 评论(0) 推荐(0) 编辑
摘要: 功能描述:table鼠标悬停显示单元格内容 1.js函数 2.调用函数 3.图示 调用前: 调用后: 阅读全文
posted @ 2019-04-28 11:00 大数据智工厂 阅读(2455) 评论(0) 推荐(1) 编辑
摘要: 1.使用队列 队列是一种那个先进先出的队列。1)创建一个队列。 2)dequeue每次从队列头部删除一个元素。 3)dequeueFirst和dequeueAll方法可以从队列中删除多个元素。 2.使用栈 栈是一种后进先出的数据结构。用push方法将元素入栈,用pop方法将元素出栈。1)创建一个任意 阅读全文
posted @ 2018-08-26 22:04 大数据智工厂 阅读(2056) 评论(0) 推荐(0) 编辑
摘要: 1.给集添加元素 1)用+=、++=和add给可变集添加元素。 2)使用+和++方法,通过向前一个集添加元素生成一个新的集。 2.从集中删除元素 1)处理可变集时,用-=和 从集中删除元素。 2)处理可变集,retain和clear删除集中元素。 3)处理可变集时,remove的返回值可以提示集是否 阅读全文
posted @ 2018-08-26 12:21 大数据智工厂 阅读(1780) 评论(0) 推荐(0) 编辑
摘要: 1.创建映射 1)创建不可变的映射 2)创建可变的映射,要么用导入的方式将其带入作用域中,要么就在创建实例时指定scala.collection.mutable.Map类的完整路径。 3)在创建的时候创建一空可变的Map,之后在添加元素。 2.Map使用的场景 1)想要返回元素按照键有序的映射,请使 阅读全文
posted @ 2018-08-25 15:33 大数据智工厂 阅读(3506) 评论(0) 推荐(2) 编辑