摘要: 互联网网页存在大量的内容重复的网页, 文本,无论对于搜索引擎,爬虫的网页去重和过滤、新闻小说等内容网站的内容反盗版和追踪,还是社交媒体等文本去重和聚类,都需要对网页或者文本进行去重和过滤。为此必须有一套高效的去重算法,要不然爬虫将做非常多的无用功,时效性等都无法得到保证,更重要的是用户体验也不好。业 阅读全文
posted @ 2020-12-15 17:28 行者AI 阅读(566) 评论(0) 推荐(0)
摘要: 测试用例可以用来衡量一个项目测试质量,因此在平时的测试流程中,编写测试用例就是测试过程中很重要的一步,每一个测试工程师都需要并且非常熟练的编写测试用例,能在编写测试用例中尽可能的覆盖任何异常的测试点;如何能编写优秀的测试用例,就需要测试人员掌握更多的用例编写技巧以及思考出更多的测试点。针对于游戏测试 阅读全文
posted @ 2020-12-15 17:02 行者AI 阅读(978) 评论(0) 推荐(0)
摘要: OpenCV是一个基于BSD许可(开源)发行的跨平台的计算机视觉和机器学习软件库,可以运行在Linux、Windows、Android和Mac OS操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计 阅读全文
posted @ 2020-12-15 15:54 行者AI 阅读(1259) 评论(0) 推荐(0)