02 2020 档案
linux环境下crypto++动态库生成与使用
摘要:1. 下载Crypto++® Library 8.2并安装 官网最新版下载地址: 8.2.0 Release $make (该步生成的静态库)$ make libcryptopp.so (执行该步生成动态库)$ sudo make install 2. 使用示例 阅读全文
posted @ 2020-02-29 09:39 yeahle 阅读(2892) 评论(0) 推荐(0)
linux系统安装openssl
摘要:1. 下载openssl openssl-1.1.1d.tar.gz tar -xzf openssl-1.1.1d.tar.gz 2.查看当前是否已安装openssl openssl version -a 3. 检查是否已安装zlib库 whereis zlib 没有则安装 yum -y inst 阅读全文
posted @ 2020-02-22 09:10 yeahle 阅读(366) 评论(0) 推荐(0)
搜索引擎—网络爬虫抓取策略
摘要:爬虫的不同抓取策略,就是利用不同的方法确定待抓取URL队列中URL优先顺序的。 爬虫的抓取策略有很多种,但不论方法如何,基本目标一致:优先选择重要网页进行抓取。 网页的重要性,评判标准不同,大部分采用网页的流行性进行定义。 效果较好或有代表性的抓取策略: 1、宽度优先遍历策略 2、非完全PageRa 阅读全文
posted @ 2020-02-16 17:27 yeahle 阅读(1311) 评论(0) 推荐(0)
这就是搜索引擎(一)—引擎架构、网络爬虫、索引建立
摘要:这个系列的文章是一只试图通过产品角度出发去理解复杂庞大搜索引擎的汪写出来的,不足之处很多,欢迎广大技术、非技术同学阅读后指正错误,我们一起探讨共同进步。 本篇主要介绍搜索引擎的架构、网络爬虫、及索引建立。 一、搜索引擎基本信息 1.1 什么是搜索引擎 通俗来讲就是从互联网海量信息中捞出用户感兴趣的内 阅读全文
posted @ 2020-02-16 09:13 yeahle 阅读(810) 评论(0) 推荐(0)
share site
摘要:IR Zettair in C The Zettair Search Engine Doc 1. 网络爬虫 搜索引擎基本原理 爬虫(爬虫原理与数据抓取) 搜索引擎-网络爬虫 3. 信息安全 3.1 paper.seebug.org 阅读全文
posted @ 2020-02-13 08:18 yeahle 阅读(152) 评论(0) 推荐(0)
BloomFilter布隆过滤器
摘要:布隆过滤器简介 布隆过滤器(BloomFilter)是1970年由布隆提出的一种空间空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并判断一个元素是否属于这个集合。使用布隆过滤器,存在第一类出错(Falsepositive),但是不会存在第二类错误(Falsenegative),因此, 阅读全文
posted @ 2020-02-11 22:28 yeahle 阅读(139) 评论(0) 推荐(0)
linux安装mongodb
摘要:1. 下载mongodb包,官方地址 $ wget http://downloads.mongodb.org/linux/mongodb-linux-x86_64-ubuntu1804-debugsymbols-4.0.16.tgz $ tar -xvzf mongodb-linux-x86_64- 阅读全文
posted @ 2020-02-09 15:08 yeahle 阅读(238) 评论(0) 推荐(0)
qtcreator download
摘要:qtcreator download 阅读全文
posted @ 2020-02-07 21:03 yeahle 阅读(92) 评论(0) 推荐(0)
crx
摘要:https://downloads.citrix.com/15575/CitrixWorkspaceApp.exe?__gda__=1580980631_b2b5a23c97dc07ea572c33bd6edb6d3d 阅读全文
posted @ 2020-02-06 16:34 yeahle 阅读(145) 评论(0) 推荐(0)
t
摘要:https://www.citrix.com/downloads/workspace-app/linux/workspace-app-for-linux-latest.html 阅读全文
posted @ 2020-02-06 14:17 yeahle 阅读(101) 评论(0) 推荐(0)
武汉第一例肺炎病例
摘要:柳叶刀报告,12月1日出现第一例,12月10日发作。到12月31日,武汉发出确诊。 阅读全文
posted @ 2020-02-05 19:45 yeahle 阅读(398) 评论(0) 推荐(0)
C语言 ## __VA_ARGS__ 宏
摘要:在GNU C中,宏可以接受可变数目的参数,就象函数一样,例如: 1 2 #define pr_debug(fmt,arg...) \ printk(KERN_DEBUG fmt, ##arg) 用可变参数宏(variadic macros)传递可变参数表 你可能很熟悉在函数中使用可变参数表,如: 1 阅读全文
posted @ 2020-02-04 21:44 yeahle 阅读(376) 评论(0) 推荐(0)
NLP之中文分词cppjieba
摘要:jieba简介 jieba库是一个简单实用的中文自然语言处理分词库。 jieba分词属于概率语言模型分词。概率语言模型分词的任务是:在全切分所得的所有结果中求某个切分方案S,使得P(S)最大。 jieba支持三种分词模式: 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧 阅读全文
posted @ 2020-02-02 18:44 yeahle 阅读(909) 评论(2) 推荐(0)