随笔分类 -  NLP

摘要:将文本分割为句子nltk.sent_tokenize(text,language)text:需要分割的文本language:语言种类czech捷克语danish丹麦语dutch荷兰语english英语estonian爱沙尼亚语finnish芬兰语french法语german德语greek希腊语ita... 阅读全文
posted @ 2015-04-13 09:43 无头咸鱼 阅读(1430) 评论(0) 推荐(0)
摘要:计算所汉语词性标记集Version 3.0制订人:刘群 张华平 张浩计算所汉语词性标记集... 10. 说明... 11. 名词 (1个一类,7个二类,5个三类) 22. 时间词(1个一类,1个二类) 23. 处所词(1个一类) 34. 方位词(1个一类) 35. ... 阅读全文
posted @ 2015-04-11 08:45 无头咸鱼 阅读(4106) 评论(0) 推荐(0)
摘要:What is Text Classification?Text classification typically involves assigning a document to a category by automated or human means. LingPipe provides a... 阅读全文
posted @ 2015-04-09 22:12 无头咸鱼 阅读(4521) 评论(1) 推荐(0)