2020年6月27日
摘要:
simhash是google用来处理海量文本去重的算法。 google出品,你懂的。 simhash最牛逼的一点就是将一个文档,最后转换成一个64位的字节,暂且称之为特征字,然后判断重复只需要判断他们的特征字的距离是不是 原理 simhash值的生成图解如下: 大概花三分钟看懂这个图就差不多怎么实现
阅读全文
posted @ 2020-06-27 15:38
yeahle
阅读(340)
推荐(0)
2020年6月26日
摘要:
大部分这种问题都能够解决,在文章的最后,提到了一种特殊情况,就是父子进程中的端口占用情况。父进程监听一个端口后,fork出一个子进程,然后kill掉父进程,再重启父进程,这个时候提示端口占用,用netstat查看,子进程占用了父进程监听的端口。 原理其实很简单,子进程在fork出来的时候,使用了写时
阅读全文
posted @ 2020-06-26 22:27
yeahle
阅读(557)
推荐(0)
2020年6月6日
摘要:
以梦为翅膀, 下载最新版本的libcurl安装包wget https://curl.haxx.se/download/curl-7.55.1.tar.gz ./buildconf // 可以用./configure --help查看其他参数。//--prefix=/usr/local指定安装目录,
阅读全文
posted @ 2020-06-06 07:41
yeahle
阅读(649)
推荐(0)
2020年5月13日
摘要:
参考 http://www.52pojie.cn/forum.php?mod=viewthread&tid=375567 下载安装包 我的打包地址 或者原作者的打包地址 Beyond Compare Pro v4.0.7.19761 CracKed For Linux 爱盘下载(原版打包加补丁文件)
阅读全文
posted @ 2020-05-13 06:56
yeahle
阅读(1047)
推荐(0)
2020年5月12日
摘要:
首先配置primary,secondary和arbiter文件 mongodb启动不了:child process failed, exited with error number 100 需要杀掉数据目录下面的lock sudo rm -f mongod.lock 然后修复 不知道为什么,对于mo
阅读全文
posted @ 2020-05-12 08:18
yeahle
阅读(143)
推荐(0)
2020年5月10日
摘要:
1. 查看当前系统有哪些版本 $ ls /usr/bin/python* 2、基于用户修改 Python 版本 想要为某个特定用户修改 Python 版本,只需要在其 home 目录下创建一个 alias(别名) 即可。打开该用户的 ~/.bashrc 文件,添加新的别名信息来修改默认使用的 Pyt
阅读全文
posted @ 2020-05-10 21:27
yeahle
阅读(1562)
推荐(0)
2020年5月1日
摘要:
MySQL Connector/C++ 1.1 Developer Guide
阅读全文
posted @ 2020-05-01 22:35
yeahle
阅读(152)
推荐(0)
2020年4月28日
摘要:
#0 0xb68e7be0 in ?? () #1 0xb7fa9d56 in __nptl_deallocate_tsd () at pthread_create.c:158 #2 0xb7fa9f83 in start_thread (arg=0xb7df0b40) at pthread_cre
阅读全文
posted @ 2020-04-28 09:03
yeahle
阅读(232)
推荐(0)
2020年4月27日
摘要:
1、查看当前的内核版本 uname -sr 2、列出系统中所有的内核版本 dpkg -l | grep linux-image | awk '{print$2}' 3、删除不在使用的内核 sudo apt remove --purge linux-image-4.4.0-21-generic第4步会
阅读全文
posted @ 2020-04-27 22:43
yeahle
阅读(519)
推荐(0)
摘要:
zip -re dest.zip destdir
阅读全文
posted @ 2020-04-27 07:12
yeahle
阅读(123)
推荐(0)