11 2011 档案

ORM for Delphi
摘要:ORMObject Relational Mapping / Persistence Frameworks for DelphihcOPF - an ORM for DelphiThis Open Source Value Type Framework provides a base class (ThcObject) composed of attribute objects that can be automatically persisted to an object store (normally an RDBMS). An object persistence framework i 阅读全文

posted @ 2011-11-22 23:40 Richard.LI 阅读(458) 评论(0) 推荐(0)

中文分词之思考
摘要:中文分词作为中文信息处理的基础手段得到广泛应用。但是应用的不同,对中文分词的要求是不同的。概而述之,可以分为三类应用:中文信息的检索中文机器翻译中文机器理解 中文信息的检索目前应用最广,如搜索引擎、数据库检索等。其对中文切词的要相对最低,最简单的二元切词法也可以取得不错的应用效果。其最大的诉求是召回率,因此切分颗粒比较细相对较好,切分大词并不一定会取得好的效果。 中文机器翻译要求切分要符合语法,如果能够和相应的目标语言成对,是最理想的。 中文机器理解要求切分符合语法并能体现语义,要求最高。 目前,各种分词技术,基于词典的,统计概率,以及混合加规则的分词方法等,都达到了一定的应用水平... 阅读全文

posted @ 2011-11-22 23:27 Richard.LI 阅读(252) 评论(0) 推荐(0)

NPL 资源(转贴)
摘要:ContentsTools: Machine Translation, POS Taggers, NP chunking, Sequence models,Parsers, Semantic Parsers/SRL, NER, Coreference,Language models, Concordances, Summarization,OtherCorpora:Large collections, Particular languages, Treebanks,Discourse,WSD,Literature,AcquisitionSGML/XMLDictionariesLexical/m 阅读全文

posted @ 2011-11-12 19:44 Richard.LI 阅读(991) 评论(0) 推荐(0)

基于转换的错误驱动的词性标注方法
摘要:•Eric Brill (1992,1995)•Transformation-based error-driven part of speech tagging•基本思想:(1)正确结果是通过不断修正错误得到的(2)修正错误的过程是有迹可循的(3)让计算机学习修正错误的过程,这个过程可以用转换规则(transformation)形式记录下来,然后用学习得到转换规则进行词性标注转换规则的形式•转换规则由两部分组成–改写规则(rewriting rule)–激活环境(triggering environment)•一个例子:转换规则T1–改写规则:将一个词的词性从动词(v)改为名词(n);–激活环 阅读全文

posted @ 2011-11-12 18:43 Richard.LI 阅读(824) 评论(0) 推荐(0)

写点什么?
摘要:最近开始一个新项目,借此地记录一点技术开发,学习历程。 阅读全文

posted @ 2011-11-11 16:03 Richard.LI 阅读(122) 评论(0) 推荐(0)

导航