05 2017 档案

摘要:emacs设置单例模式的本质就是使用下列参数启动: C:\emacs 24.5\bin\emacsclientw.exe no wait alternate editor="C:\emacs 24.5\bin\runemacs.exe" "%1" 如果是设置个快捷方式图标什么的还好,可以直接加参数, 阅读全文
posted @ 2017-05-31 19:10 叫我家宝 阅读(273) 评论(0) 推荐(0)
摘要:原文链接:https://www.elastic.co/blog/found similarity in elasticsearch 原文 By Konrad Beiske 翻译 By 高家宝 译者按 该文虽然名为 ,实际上多数篇幅讲的都是信息检索邻域的通用相似度模型。其中涉及到具体实现的部分,El 阅读全文
posted @ 2017-05-12 21:49 叫我家宝 阅读(15044) 评论(0) 推荐(0)
摘要:原文链接: https://www.elastic.co/blog/found bm vs lucene default similarity 原文 By Konrad Beiske 翻译 By 高家宝 这篇文章是之前讨论相似度模型(vsm和bm25)的 "文章" 的后续,在这篇文章中我们将使用维基 阅读全文
posted @ 2017-05-12 19:05 叫我家宝 阅读(3487) 评论(0) 推荐(0)
摘要:综述 在进行搜索的时候,文档中的同一个词往往有多种表达方法,这种现象叫做同义词。比如用户输入"充电宝",而文档里有"移动电源",这时如果搜索系统没有做查询优化的话用户是不能找到相关文档的。由此我们引出查询优化的概念。 查询优化方法大体可以分为两类: 1. 全局方法 :在不考虑原始查询初始返回文档的情 阅读全文
posted @ 2017-05-10 14:24 叫我家宝 阅读(3908) 评论(0) 推荐(1)
摘要:测试数据集 1. 一个文档集 2. 一组用于测试的信息需求集合,信息需求可以表示为查询 3. 一组相关性判定结果,对应每个查询 文档,通常会赋予一个二值判定结果: 相关/不相关 经验发现一般测试的查询数应 =50。 无序检索结果的评价 准确率和召回率 对于一个查询,根据其返回结果可以将整个文档集划分 阅读全文
posted @ 2017-05-09 15:49 叫我家宝 阅读(2938) 评论(0) 推荐(1)