11 2021 档案

摘要:最近在做一个多线程的爬虫程序,由于队列中有重复的数据,尽管程序中有判断不存在则插入,但由于多个线程并发,导致数据库中存在部分重复的数据。 程序中的bug已经修复,但重新爬一遍耗时耗力,于是就选择删除重复的数据,只保留一条有效数据 解决的思路就是根据确定其数据唯一的聚合字段进行分组,然后只保留一条有效 阅读全文
posted @ 2021-11-06 11:12 hello-*-world 阅读(1847) 评论(0) 推荐(0)
摘要:Jenkins是一款由java开发的持续集成的工具,能帮我们自动打包和部署 一.安装 1.下载docker镜像 docker pull jenkins/jenkins 2.在宿主机上创建jenkins_home文件,用来挂载容器中对应的目录。 mkdir /mnt/jenkins_home 创建完对 阅读全文
posted @ 2021-11-05 17:46 hello-*-world 阅读(423) 评论(0) 推荐(0)