会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
佟学强
where there is a will,there is a way!All things are difficult before they are easy!
博客园
首页
新随笔
联系
管理
订阅
上一页
1
···
3
4
5
6
7
8
下一页
2016年10月13日
转载:scala中的implicit
摘要: 掌握implicit的用法是阅读Spark源码的基础,也是学习Scala其它的开源框架的关键,implicit 可分为: 隐式参数 隐式转换类型 隐式调用函数 1.隐式参数 当我们在定义方法时,可以把最后一个参数列表标记为implicit,表示该组参数是隐式参数。一个方法只会有一个隐式参数列表,置于
阅读全文
posted @ 2016-10-13 12:34 佟学强
阅读(810)
评论(0)
推荐(0)
2016年5月25日
原创:C++实现的可排序的双向链表
摘要: 学习C++有一周了,今天用C++设计了一个双向链表,这个链表有排序功能,默认按升序排列,接受的参数可以是数字,也可以是字符串。现在把自己写的代码,分享出来。如果链表中接受的对象为Lexeme,可以用于存储中文分词机械化分词后的结果集。 QuickSortSet.h #ifndef DOUBLE_LI
阅读全文
posted @ 2016-05-25 19:07 佟学强
阅读(656)
评论(0)
推荐(0)
2016年5月19日
原创:ThreadPoolExecutor线程池深入解读(一)----原理+应用
摘要: 本文档,适合于对多线程有一定基础的开发人员。对多线程的一些基础性的解读,请参考《java并发编程》的前5章。 对于源代码的解读,本人认为可读可不读。如果你想成为一位顶级的程序员,那就培养自己底层的逻辑能力,自己写算法,然后让别人学习你的源代码。研究源代码这件事,更多的是针对于初学者。贡献源码的人,也
阅读全文
posted @ 2016-05-19 17:47 佟学强
阅读(2266)
评论(0)
推荐(0)
2016年5月12日
原创:搜索算法之两个数组取交集的算法
摘要: 在垂直搜索中,有很多方法可以控制返回结果的数量。比如用户输入"上海世博会",要求只显示跟上海世博会相关的内容。有三种方法可以参考:①BooleanQuery,AND逻辑②phraseQuery,精读最高,只出现"上海世博会"连续的短语的文档③solr的模糊匹配查询。如果采用第一种方案,在垂直搜索中(
阅读全文
posted @ 2016-05-12 19:44 佟学强
阅读(7315)
评论(0)
推荐(0)
2016年4月13日
原创:中文分词的逆向最大匹配算法
摘要: 逆向最大匹配算法,中文分词机械化分词中最基本的算法,也是入门级别的算法。但是,在机械化分词方面的效果,表现却很好。尤其是在大文本的时候,一次取较多词语进行匹配,因为大文本匹配成词的概率远远高于小文本,所以会有很好的表现。IK分词,在中文分词领域里,只能算是皮毛,或者说是一个壳儿而已,根本不算真正的分
阅读全文
posted @ 2016-04-13 21:31 佟学强
阅读(2348)
评论(0)
推荐(0)
2016年3月12日
搜索推荐系统根据用户搜索频率(热搜)排序
摘要: 之前写的三叉树,有点儿简单,并不能满足实际项目的需要。先简单分析一下solr中搜索推荐系统的核心算法。 wiki中有关于solr的搜索推荐的详细描述,但是核心算法需要自己查看源代码。关于wiki上的解读,之前做了一次简单的翻译,根据此文档,详细研读了源代码,先把核心思想呈现出来。 基本流程如下:当用
阅读全文
posted @ 2016-03-12 20:03 佟学强
阅读(2188)
评论(0)
推荐(0)
原创:Solr Wiki 中关于Suggester(搜索推荐)的简单解读
摘要: Solr Wiki Suggester Suggester - a flexible "autocomplete" component.(搜索推荐) Solr Wiki Suggester Suggester - a flexible "autocomplete" component.(搜索推荐)
阅读全文
posted @ 2016-03-12 17:22 佟学强
阅读(1017)
评论(0)
推荐(0)
2016年3月8日
从海量文本中统计出前k个频率最高的词语
摘要: 现有如下题目:有一个海量文本,存储的是汉语词语,要求从中找出前K个出现频率最高的词语,写出最优算法,兼顾时间和空间复杂度。 思路分析:熟悉搜索引擎的程序员,应该不是难题。用传统的HashMap是无法解决的,因为数据量非常庞大的时候,空间复杂度会导致程序运行时,频繁执行MinorGC和MajorGC,
阅读全文
posted @ 2016-03-08 18:45 佟学强
阅读(1395)
评论(0)
推荐(0)
原创:从海量数据中查找出前k个最小或最大值的算法(java)
摘要: 现在有这么一道题目:要求从多个的数据中查找出前K个最小或最大值 分析:有多种方案可以实现。一、最容易想到的是先对数据快速排序,然后输出前k个数字。 二、先定义容量为k的数组,从源数据中取出前k个填充此数组,调整此数组的最大值maxValue到首位,然后对剩下的n-k个数据迭代,对于每个遍历到的数字x
阅读全文
posted @ 2016-03-08 18:25 佟学强
阅读(6627)
评论(1)
推荐(0)
2016年3月3日
一个经典的字母排列算法
摘要: 最近在研究一个问题,自己尝试些写了一个算法: 问题描述:给出一段字符,比如[a,b,c,d……],输出任意长度大于n的字符组合 分析:首先确立数学模型。这个问题的本质是排列问题,即:AL2 + AL3 + …… + ALL。既然是排列问题,就应该按照排列的思维来进行处理这个问题。首先不去分析具体的实
阅读全文
posted @ 2016-03-03 20:17 佟学强
阅读(884)
评论(0)
推荐(0)
上一页
1
···
3
4
5
6
7
8
下一页
公告