11 2021 档案
摘要:最近在做一个多线程的爬虫程序,由于队列中有重复的数据,尽管程序中有判断不存在则插入,但由于多个线程并发,导致数据库中存在部分重复的数据。 程序中的bug已经修复,但重新爬一遍耗时耗力,于是就选择删除重复的数据,只保留一条有效数据 解决的思路就是根据确定其数据唯一的聚合字段进行分组,然后只保留一条有效
阅读全文
摘要:Jenkins是一款由java开发的持续集成的工具,能帮我们自动打包和部署 一.安装 1.下载docker镜像 docker pull jenkins/jenkins 2.在宿主机上创建jenkins_home文件,用来挂载容器中对应的目录。 mkdir /mnt/jenkins_home 创建完对
阅读全文

浙公网安备 33010602011771号