2020年6月27日
摘要: simhash是google用来处理海量文本去重的算法。 google出品,你懂的。 simhash最牛逼的一点就是将一个文档,最后转换成一个64位的字节,暂且称之为特征字,然后判断重复只需要判断他们的特征字的距离是不是 原理 simhash值的生成图解如下: 大概花三分钟看懂这个图就差不多怎么实现 阅读全文
posted @ 2020-06-27 15:38 yeahle 阅读(340) 评论(0) 推荐(0)
  2020年6月26日
摘要: 大部分这种问题都能够解决,在文章的最后,提到了一种特殊情况,就是父子进程中的端口占用情况。父进程监听一个端口后,fork出一个子进程,然后kill掉父进程,再重启父进程,这个时候提示端口占用,用netstat查看,子进程占用了父进程监听的端口。 原理其实很简单,子进程在fork出来的时候,使用了写时 阅读全文
posted @ 2020-06-26 22:27 yeahle 阅读(557) 评论(0) 推荐(0)
  2020年6月6日
摘要: 以梦为翅膀, 下载最新版本的libcurl安装包wget https://curl.haxx.se/download/curl-7.55.1.tar.gz ./buildconf // 可以用./configure --help查看其他参数。//--prefix=/usr/local指定安装目录, 阅读全文
posted @ 2020-06-06 07:41 yeahle 阅读(649) 评论(0) 推荐(0)
  2020年5月13日
摘要: 参考 http://www.52pojie.cn/forum.php?mod=viewthread&tid=375567 下载安装包 我的打包地址 或者原作者的打包地址 Beyond Compare Pro v4.0.7.19761 CracKed For Linux 爱盘下载(原版打包加补丁文件) 阅读全文
posted @ 2020-05-13 06:56 yeahle 阅读(1047) 评论(0) 推荐(0)
  2020年5月12日
摘要: 首先配置primary,secondary和arbiter文件 mongodb启动不了:child process failed, exited with error number 100 需要杀掉数据目录下面的lock sudo rm -f mongod.lock 然后修复 不知道为什么,对于mo 阅读全文
posted @ 2020-05-12 08:18 yeahle 阅读(143) 评论(0) 推荐(0)
  2020年5月10日
摘要: 1. 查看当前系统有哪些版本 $ ls /usr/bin/python* 2、基于用户修改 Python 版本 想要为某个特定用户修改 Python 版本,只需要在其 home 目录下创建一个 alias(别名) 即可。打开该用户的 ~/.bashrc 文件,添加新的别名信息来修改默认使用的 Pyt 阅读全文
posted @ 2020-05-10 21:27 yeahle 阅读(1562) 评论(0) 推荐(0)
  2020年5月1日
摘要: MySQL Connector/C++ 1.1 Developer Guide 阅读全文
posted @ 2020-05-01 22:35 yeahle 阅读(152) 评论(0) 推荐(0)
  2020年4月28日
摘要: #0 0xb68e7be0 in ?? () #1 0xb7fa9d56 in __nptl_deallocate_tsd () at pthread_create.c:158 #2 0xb7fa9f83 in start_thread (arg=0xb7df0b40) at pthread_cre 阅读全文
posted @ 2020-04-28 09:03 yeahle 阅读(232) 评论(0) 推荐(0)
  2020年4月27日
摘要: 1、查看当前的内核版本 uname -sr 2、列出系统中所有的内核版本 dpkg -l | grep linux-image | awk '{print$2}' 3、删除不在使用的内核 sudo apt remove --purge linux-image-4.4.0-21-generic第4步会 阅读全文
posted @ 2020-04-27 22:43 yeahle 阅读(519) 评论(0) 推荐(0)
摘要: zip -re dest.zip destdir 阅读全文
posted @ 2020-04-27 07:12 yeahle 阅读(123) 评论(0) 推荐(0)