上一页 1 ··· 3 4 5 6 7 8 下一页
摘要: 掌握implicit的用法是阅读Spark源码的基础,也是学习Scala其它的开源框架的关键,implicit 可分为: 隐式参数 隐式转换类型 隐式调用函数 1.隐式参数 当我们在定义方法时,可以把最后一个参数列表标记为implicit,表示该组参数是隐式参数。一个方法只会有一个隐式参数列表,置于 阅读全文
posted @ 2016-10-13 12:34 佟学强 阅读(794) 评论(0) 推荐(0) 编辑
摘要: 学习C++有一周了,今天用C++设计了一个双向链表,这个链表有排序功能,默认按升序排列,接受的参数可以是数字,也可以是字符串。现在把自己写的代码,分享出来。如果链表中接受的对象为Lexeme,可以用于存储中文分词机械化分词后的结果集。 QuickSortSet.h #ifndef DOUBLE_LI 阅读全文
posted @ 2016-05-25 19:07 佟学强 阅读(628) 评论(0) 推荐(0) 编辑
摘要: 本文档,适合于对多线程有一定基础的开发人员。对多线程的一些基础性的解读,请参考《java并发编程》的前5章。 对于源代码的解读,本人认为可读可不读。如果你想成为一位顶级的程序员,那就培养自己底层的逻辑能力,自己写算法,然后让别人学习你的源代码。研究源代码这件事,更多的是针对于初学者。贡献源码的人,也 阅读全文
posted @ 2016-05-19 17:47 佟学强 阅读(2238) 评论(0) 推荐(0) 编辑
摘要: 在垂直搜索中,有很多方法可以控制返回结果的数量。比如用户输入"上海世博会",要求只显示跟上海世博会相关的内容。有三种方法可以参考:①BooleanQuery,AND逻辑②phraseQuery,精读最高,只出现"上海世博会"连续的短语的文档③solr的模糊匹配查询。如果采用第一种方案,在垂直搜索中( 阅读全文
posted @ 2016-05-12 19:44 佟学强 阅读(7188) 评论(0) 推荐(0) 编辑
摘要: 逆向最大匹配算法,中文分词机械化分词中最基本的算法,也是入门级别的算法。但是,在机械化分词方面的效果,表现却很好。尤其是在大文本的时候,一次取较多词语进行匹配,因为大文本匹配成词的概率远远高于小文本,所以会有很好的表现。IK分词,在中文分词领域里,只能算是皮毛,或者说是一个壳儿而已,根本不算真正的分 阅读全文
posted @ 2016-04-13 21:31 佟学强 阅读(2290) 评论(0) 推荐(0) 编辑
摘要: 之前写的三叉树,有点儿简单,并不能满足实际项目的需要。先简单分析一下solr中搜索推荐系统的核心算法。 wiki中有关于solr的搜索推荐的详细描述,但是核心算法需要自己查看源代码。关于wiki上的解读,之前做了一次简单的翻译,根据此文档,详细研读了源代码,先把核心思想呈现出来。 基本流程如下:当用 阅读全文
posted @ 2016-03-12 20:03 佟学强 阅读(2108) 评论(0) 推荐(0) 编辑
摘要: Solr Wiki Suggester Suggester - a flexible "autocomplete" component.(搜索推荐) Solr Wiki Suggester Suggester - a flexible "autocomplete" component.(搜索推荐) 阅读全文
posted @ 2016-03-12 17:22 佟学强 阅读(958) 评论(0) 推荐(0) 编辑
摘要: 现有如下题目:有一个海量文本,存储的是汉语词语,要求从中找出前K个出现频率最高的词语,写出最优算法,兼顾时间和空间复杂度。 思路分析:熟悉搜索引擎的程序员,应该不是难题。用传统的HashMap是无法解决的,因为数据量非常庞大的时候,空间复杂度会导致程序运行时,频繁执行MinorGC和MajorGC, 阅读全文
posted @ 2016-03-08 18:45 佟学强 阅读(1364) 评论(0) 推荐(0) 编辑
摘要: 现在有这么一道题目:要求从多个的数据中查找出前K个最小或最大值 分析:有多种方案可以实现。一、最容易想到的是先对数据快速排序,然后输出前k个数字。 二、先定义容量为k的数组,从源数据中取出前k个填充此数组,调整此数组的最大值maxValue到首位,然后对剩下的n-k个数据迭代,对于每个遍历到的数字x 阅读全文
posted @ 2016-03-08 18:25 佟学强 阅读(6542) 评论(1) 推荐(0) 编辑
摘要: 最近在研究一个问题,自己尝试些写了一个算法: 问题描述:给出一段字符,比如[a,b,c,d……],输出任意长度大于n的字符组合 分析:首先确立数学模型。这个问题的本质是排列问题,即:AL2 + AL3 + …… + ALL。既然是排列问题,就应该按照排列的思维来进行处理这个问题。首先不去分析具体的实 阅读全文
posted @ 2016-03-03 20:17 佟学强 阅读(851) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 下一页