最新评论
Re:静思录 程序第一 euler 2010-04-07 15:01
居高临下,精彩!期待下文
re: 静思录 命名第二 沧海月明 2009-02-14 19:42
哈哈:)
re: 静思录 程序第一 冰の酷龙 2009-02-14 13:00
静思,很讨厌不停得查阅,但没有办法,无规矩不成程序。
re: 静思录 命名第二 勇者之心 2009-02-14 11:48
@沧海月明
虽然讨论哲学话题有点儿扯远了,不过还是说两句我的看法:)
quicksort这个名字与它指代的内容虽然确实"存在"于这个世界上,但它不能算是"客观实在",所以快排算法不是物质,它和数学定理、物理理论以及其他计算机程序所描述的对象一样本身就是人类的意识成果。不是人们用油墨或记忆在反映快排算法;而是一些从物质世界中抽象出来的规律和概念(例如小于、等于和分治策略等)决定了快排的实际内容;
至于列宁同学说的这句话,确实有命名游戏之嫌,所谓“有”,应该是用来指代“客观实在”这个概念,想来是该生在物质与意识的本原性分争中太过投入的原故。与此呼应的,王阳明先生的"心外无理"说,其实也并非不承认竹子的存在,只是这个“理”所指代的概念(礼)已经发生了变化而已。
总体来说,名实关系,确实是一个应该认真看待的问题。
re: 静思录 命名第二 沧海月明 2009-02-14 10:37
世界上除了运动着的物质,什么也没有。 ——弗拉基米尔·伊里奇·乌里扬诺夫
==============================
一个算法是什么?比如quicksort, 它是物质吗?它客观存在,但你总不能说印在教科书里的那点油墨和油墨的载体纸张是quicksort吧?也不能说你我脑电波中或者脑细胞中存贮的关于quicksort的记忆是quicksort吧? 因为它不因为你我的记忆错误或者印刷错误就变得不正确了。那它到底是什么呢?
同样我们的程序真的仅是电脑硬盘里的排列的磁性分子吗?如果不是,我们的程序又是什么物质?
re: 静思录 程序第一 9958 2009-02-13 11:33
修炼着、修炼着,就成精了。
re: 静思录 程序第一 勇者之心 2009-02-12 21:36
re: 静思录 程序第一 施杨 2009-02-12 20:10
天啊,讲的很有深度。写程序就是为了终结写程序。
re: 静思录 程序第一 lexus 2009-02-12 17:03
LOP是什么能解释下吗?
re: 静思录 程序第一 3echo 2009-02-12 15:13
"一定还有其他更好的办法能够提高程序代码的生产效率",我坚信这样的一天一定会到来!支持你!
re: 静思录 程序第一 雨后彩虹 2009-02-12 11:46
每天都要这样找别人代码里的方法真是痛苦
re: 静思录 程序第一 kikop 2009-02-12 10:35
有深度,期待中
re: 静思录 程序第一 海豹军团 2009-02-12 10:17
有时我们确实要停下来思考一下.期待博主能给我们新的启发
re: 静思录 程序第一 hazel 2009-02-12 09:49
潜力贴
re: 静思录 程序第一 cumt吴波 2009-02-12 09:01
前面几句蛮经典的
re: 静思录 程序第一 张蒙蒙 2009-02-12 08:54
期盼下文到底是怎样的办法。
re: 静思录 程序第一 llill 2009-02-12 01:17
累..
re: 静思录 程序第一 王立斌 2009-02-12 00:31
潜力开发帖。顶。
re: 静思录 程序第一 海洋——海纳百川,有容乃大. 2009-02-12 00:25
期待续!!
re: 静思录 程序第一 yzlhccdec 2009-02-12 00:16
其实,我不想当程序员
re: 小议分词 我是谁~~~~ 2008-02-14 20:52
嘻嘻嘻。。。。。
re: 小议分词 xingfu9966 2007-09-18 10:38
我也在研究这个方面,大家一起学习。
re: MSIL 初级读本 第二部分:局部变量 archer 2007-03-20 16:04
thanks for your share
re: MSIL 初级读本 第二部分:局部变量 虫子[匿名] 2007-01-03 15:23
good!
re: DotLucene 的锁。。。 Lucene 2006-11-27 17:01
re: DotLucene 的锁。。。 Lucene 2006-11-27 17:00
目前我在做相关修改
感兴趣的朋友可以看看
re: 小议分词 ttscj 2006-08-29 19:49
希望交流一下 495489975
re: 小议分词 zhengdi 2006-07-21 02:20
呵呵!学习一下,
我也在研究这方面 ,17868755
涉及到使用reader的实现,大家一定要仔细检查源代码,不少地方都存在try所说的问题,其实如果没有特殊需求的话,建议大家用1.4final那个版本。
re: DotLucene 小谷 2006-07-08 19:39
是啊,感觉DotLucene问题不少啊,如果有可能的话,咱们把咱们需要用到的部分重新实现一下吧,顺便也确保代码中不会有这样的问题。
re: 小议分词 勇者之心 2006-07-07 10:32
@pwqzc
有看没有懂。。。是您有问题,还是我写得有问题?
re: 小议分词 edison1024 2006-07-07 08:31
学习学习.顶
re: 小议分词 pwqzc 2006-07-07 08:03
世界杯
我很郁闷怎么查世界杯就查不到这文档?
LZ有必要认真看看
@andyhugb
中科院那个分词有一定的不确定性,分词结果(包括切分结果和词性标注)是和上下文相关的。举个例子:“工程师” 有时候是个整体;有时候被分成“工程”“师”;如果索引时和查询时的分词结果不一致显然就会遗漏一些文档。
另外就是 Lucene 有一个最大的 Token 限制,文档超长部分是不索引的。不过可以修改这个数值。
建议你用找不到的那篇文档单独做一个索引,并且在查询的时候跟到Query的成员方法里边去,确认具体原因。
偶滴邮件 system.console[at]gmail.com 欢迎讨论。
re: DotLucene 之 Bugs 小记 andyhugb 2006-05-30 19:36
勇者之心
您好!我用 dot lucene1.9 做中文检索,切词用得是中科院的分词,索引完后,我试着将索引字典里的词都检索一遍,发现检索有些词找不到一个文档,用java lucene1.9 也是一样。但我用 dot lucene 1.4 或java lucene 1.4就没有这个问题, 请问您碰到过这样的问题吗?
我也发个bug
位置:Analysis\KeywordTokenizer.cs 51 行
重要度:1000
描述与原因:
如果搜索的时候使用 KeywordAnalyzer 则会死循环,非常严重
if (length == -1)修改为 if (length == 0)即可
read读完后应该为0不是-1
@一帆(老鼠粮仓之路)
andyhugb 的方法就可以达成你需求了,通过 PhraseQuery.SetSlop(int) 方法还可以设置词之间所允许的间隔词数量。例如,查询“Software Engineer”时设置 slop = 1,则 “Software Testing Engineer”、“Software Requirement Engineer” 等结果也会入选。
或者直接使用 ASCII 的引号将你的短语括起来,传递给 QueryParser.Parse 方法就可以得到所需的 Query 对象。
推荐《Lucene In Action》这本书。
http://www.lucene.com.cn/Lucene_in_%20Action.pdf
里面提到应用 TermPositionVector 来计算两个文档之间的相关程度的方式。典型的应用场合是:“与这篇文档类似的文档有哪些?”
re: DotLucene 之 Bugs 小记 andyhugb 2006-04-18 20:51
@一帆(老鼠粮仓之路)
你就是想要搜索词组吧
PhraseQuery query = new PhraseQuery();
query.add(new Term(field,A));
query.add(new Term(field,B));
re: DotLucene 之 Bugs 小记 一帆(老鼠粮仓之路) 2006-04-17 13:26
我想实现这样的效果:
搜索A和B,但是A和B的中间不能够出现其他的文字
是不是要用到TermPositionVector啊?
怎么用?怎么实现这样的效果?
非常感谢你的指点
re: DotLucene 之 Bugs 小记 andyhugb 2006-04-12 22:59
@勇者之心
else
{
//uniques.Add(query, query);
if (!uniques.ContainsKey(query))
uniques.Add(query, query);
}
在Query.cs 155行,添加注释的是原来的语句,如果用MultiSearcher在多个索引目录查询,会会发生重复插入的错误 。
紧接着else的下面的代码也有问题
if (uniques.Count == 1)
{
//return (Query)uniques.GetEnumerator().Current;
System.Collections.IDictionaryEnumerator it1 = uniques.GetEnumerator();
it1.MoveNext();
System.Collections.DictionaryEntry curr = (System.Collections.DictionaryEntry)it1.Current;
return (Query)curr.Key;
}
注释了的是原来的,然后我添加了。不用MultiSearcher的不会出现上述问题
@andyhugb
保存searchable对象的 searchables 好像是个数组阿,楼上的大哥说的是哪个Hashtable 阿?
re: DotLucene 之 Bugs 小记 andyhugb 2006-04-08 20:41
MultiSearcher也有一个bug,java版本用了一个Hashset, C#没有hashset,作者直接用Hashtable代替,会发生重复插入的错误
re: DotLucene 之 Bugs 小记 Leaphy 2006-04-03 11:23
@FL800.NET
这个。。。我认为。。。
例如:
class MyComparer : IComparer
{
public int Compare(object x, object y)
{
return string.CompareOrdinal(x as string, y as string);
}
}
。。。。。。
BinarySearch(array, obj, new MyComparer());
就好了。。。
re: DotLucene 之 Bugs 小记 FL800.NET 2006-03-28 18:04
请教大哥关于第三条的BUG:
Array.BinarySearch(Array,object) 方法使用的是 String.Compare
但是这第三个参数的接口,我该如何定义成CompareOrdinal的比较方式呢?
public static int BinarySearch(Array, object, IComparer);
谢谢!!!
re: DotLucene 的锁。。。 FL800.NET 2006-03-28 16:55
写得不错, 支持一下.
还有无其他经验可以分享一下.... 向你学习.