随笔分类 - NLP
摘要:将文本分割为句子nltk.sent_tokenize(text,language)text:需要分割的文本language:语言种类czech捷克语danish丹麦语dutch荷兰语english英语estonian爱沙尼亚语finnish芬兰语french法语german德语greek希腊语ita...
阅读全文
摘要:计算所汉语词性标记集Version 3.0制订人:刘群 张华平 张浩计算所汉语词性标记集... 10. 说明... 11. 名词 (1个一类,7个二类,5个三类) 22. 时间词(1个一类,1个二类) 23. 处所词(1个一类) 34. 方位词(1个一类) 35. ...
阅读全文
摘要:What is Text Classification?Text classification typically involves assigning a document to a category by automated or human means. LingPipe provides a...
阅读全文