上一页 1 ··· 229 230 231 232 233 234 235 236 237 ··· 274 下一页
摘要: from:http://www.cnblogs.com/jcli/p/3984809.html 如果待合并的两个倒排表数据量很大, 但是交集很少时, 会是什么情况呢? 1 2 [1, 2, 3, 4, 5, ... 10001, 10005] [1, 10001, 10008] 如果对这两个做合并操 阅读全文
posted @ 2017-03-20 16:11 bonelee 阅读(2934) 评论(0) 推荐(0)
摘要: 离线方式在Ubuntu 18.04 上安装Docker 操作系统需求:Ubuntu 18.04 Docker deb 包下载地址: https://download.docker.com/linux/ubuntu/dists/bionic/pool/stable/amd64/ 下载三个文件: con 阅读全文
posted @ 2017-03-19 23:02 bonelee 阅读(1492) 评论(0) 推荐(0)
摘要: 见:http://blog.csdn.net/dingsai88/article/details/52638758 阅读全文
posted @ 2017-03-19 22:54 bonelee 阅读(2178) 评论(0) 推荐(0)
摘要: searcher.Search(types.SearchRequest{Text: "百度中国"}) 索引器接受查找请求: lookup函数实现: 阅读全文
posted @ 2017-03-19 22:19 bonelee 阅读(358) 评论(0) 推荐(0)
摘要: 之前的文章分析过,接受索引请求处理的代码在segmenter_worker.go里: 上面代码的作用就是在统计词频和单词位置(注意:tag也是作为搜索的单词,不过其词频是0,而无法参与tf-idf计算),并封装为indexerRequest,发送给engine.indexerAddDocumentC 阅读全文
posted @ 2017-03-19 21:27 bonelee 阅读(268) 评论(0) 推荐(0)
摘要: defer Go语言中有种不错的设计,即延迟(defer)语句,你可以在函数中添加多个defer语句。当函数执行到最后时,这些defer语句会按照逆序执行,最后该函数返回。特别是当你在进行一些打开资源的操作时,遇到错误需要提前返回,在返回前你需要关闭相应的资源,不然很容易造成资源泄露等问题。如下代码 阅读全文
posted @ 2017-03-19 21:05 bonelee 阅读(2846) 评论(0) 推荐(0)
摘要: 前面说过,接收indexerRequest的代码在index_worker.go里: 持久化的代码:engine/persistent_storage_worker.go 可以看到,倒排索引存在DB里是丑陋的,直接set(key, value) 其中,key是倒排列表的关键字,而value是doc 阅读全文
posted @ 2017-03-19 20:46 bonelee 阅读(408) 评论(0) 推荐(0)
摘要: 数组切片内容复制 转自:http://studygolang.com/articles/4560 用于将内容从一个数组切片复制到另一个数组切片。如果加入的两个数组切片不一样大,就会按其中较小的那个数组切片的元素个数进行复制。 阅读全文
posted @ 2017-03-19 20:05 bonelee 阅读(8526) 评论(0) 推荐(0)
摘要: 使用libmongoc,参考:http://mongoc.org/libmongoc/current/mongoc_gridfs_t.html 阅读全文
posted @ 2017-03-17 20:29 bonelee 阅读(1409) 评论(0) 推荐(0)
摘要: fmemopen()函数打开一个内存流,使你可以读取或写入由buf指定的缓冲区。其返回FILE*fp就是打开的内存流,虽然仍使用FILE指针进行访问,但其实并没有底层文件(并没有磁盘上的实际文件,因为打开的内存流fp是在内存中的),所有的I/O都是通过在缓冲区与主存(就是内存)之间来回传送字节来完成 阅读全文
posted @ 2017-03-17 19:30 bonelee 阅读(5500) 评论(2) 推荐(0)
上一页 1 ··· 229 230 231 232 233 234 235 236 237 ··· 274 下一页