11 2018 档案
摘要:1.安装Nodejs和AnyProxy以及安装模拟器(移动端抓包工具) 第一步:nodejs下载地址:http://nodejs.cn/download/ 下载Windows版本,直接运行安装即可, 参照之前的 nodejs文章https://www.cnblogs.com/atimo/p/9848
阅读全文
摘要:比较两个文件中的文本的相似度(纯文本文件);5种文件:word、excel、ppt、pdf、txt;提取5中文件中的所有文本,作比对。计算相似度;1.读取文件 1).读word文件 2).读取PDF 3).读txt文件 4.读取PPT 5.读Excel 文件转换为二进制的方法: 6.准备工作: 6.
阅读全文
摘要:最近项目需求,做一些新闻站点的爬取工作。1.简单的jsoup爬取,静态页面形式; 通过jsop解析返回Document 使用标签选择器,选择页面标签中的值,即可获取页面内容。 2.延时加载,有些网站存在延时加载,表格内容,或者嵌入页面形式的加载的页面;属于jsop范围 获取到的是Document 使
阅读全文
摘要:使用Nosql Manager for MongoDB 管理工具1.管理工具 模糊查询 模糊查询条件包含在 ‘/’之间2.java 连接MongoDB,条件查询 2.1 连接MongoDB服务,并创建连接数据库对象。 // 连接到 mongodb 服务 MongoClient mongoClient
阅读全文

浙公网安备 33010602011771号