随笔分类 -  自然语言处理

摘要:Stemmers 在英语中,一个单词常常是另一个单词的“变种”,如:happy= happiness,这里happy叫做happiness的词干(stem)。在信息检索系统中,我们常常做的一件事,就是在Term规范化过程中,提取词干(stemming),即除去英文单词分词变换形式的结尾。 本文主要介 阅读全文
posted @ 2020-02-02 12:37 Patrick_Liu 阅读(2661) 评论(0) 推荐(0)
摘要:ROOT:要处理文本的语句 IP:简单从句NP:名词短语VP:动词短语PU:断句符,通常是句号、问号、感叹号等标点符号LCP:方位词短语PP:介词短语CP:由‘的’构成的表示修饰性关系的短语DNP:由‘的’构成的表示所属关系的短语ADVP:副词短语ADJP:形容词短语DP:限定词短语QP:量词短语N 阅读全文
posted @ 2017-03-04 10:13 Patrick_Liu 阅读(6750) 评论(0) 推荐(0)
摘要:Ag 形语素 形容词性语素。形容词代码为 a,语素代码g前面置以A。 a 形容词 取英语形容词 adjective的第1个字母。 ad 副形词 直接作状语的形容词。形容词代码 a和副词代码d并在一起。 an 名形词 b 区别词 c 连词 dg 副语素 d 副词 e 叹词 f 方位词 g 语素 h 前 阅读全文
posted @ 2016-11-23 09:26 Patrick_Liu 阅读(1033) 评论(0) 推荐(0)