随笔分类 -  ML

Machine Learning
摘要:在运行Stanford CoreNLP过程中会用到tokenize,pos等参数,这些以常量形式定义在edu.stanford.nlp.pipeline.Annotator中,具体如下: /** * These are annotators which StanfordCoreNLP knows h 阅读全文
posted @ 2016-05-13 15:39 大刀客 阅读(656) 评论(0) 推荐(0)
摘要:分句功能参考 Stanford Tokenizer。 在edu.stanford.nlp.pipeline包中实现了一系列分词分句功能,其中SentenceAnnotator类实现了对文件分句功能. 运行Demo程序:在edu.stanford.nlp.pipeline.demo包中找到Stanfo 阅读全文
posted @ 2016-05-13 14:28 大刀客 阅读(3064) 评论(0) 推荐(0)
摘要:Standford Named Entities Recognizer(NER),命名实体识别是信息提取(Information Extraction)的一个子任务,它把文字的原子元素(Atomic Element)定位和分类好,然后输出为固定格式的目录,例如: 人名、组织、位置、时间的表示、数量、 阅读全文
posted @ 2016-05-11 11:29 大刀客 阅读(927) 评论(0) 推荐(0)
摘要:Stanford CoreNLP Part Of Speech简称POS,主要是对待分析的句子中的单词进行标记的功能,如标记名词、动词等,该组件是CoreNLP工程的一部分,详细内容可参考:CoreNLP POS,使用POS 阅读全文
posted @ 2016-05-11 09:36 大刀客 阅读(673) 评论(0) 推荐(0)
摘要:Stanford CoreNLP功能之一是Sentiment Analysis(情感分析),可以标识出语句的正面或者负面情绪,包括:Positive,Neutral,Negative三个值。 运行有两种方式:命令行和Eclipse运行,两种方式都需要编译源代码,源码可以在http://stanfor 阅读全文
posted @ 2016-05-06 11:28 大刀客 阅读(3254) 评论(0) 推荐(0)
摘要:Standford CoreNLP包含很多功能,github上有源码,github地址:Stanford CoreNLP,有需要的话可以下载看看。 主要内容在网站上都有描述,原文是这样写的: Choose Stanford CoreNLP if you need: An integrated too 阅读全文
posted @ 2016-05-06 11:13 大刀客 阅读(3835) 评论(0) 推荐(0)
摘要:以下是Stanford parser中的标记中文释义供参考。 probabilistic context-free grammar(PCFG) ROOT:要处理文本的语句 IP:简单从句 NP:名词短语 VP:动词短语 PU:断句符,通常是句号、问号、感叹号等标点符号 LCP:方位词短语 PP:介词 阅读全文
posted @ 2016-04-29 11:34 大刀客 阅读(4368) 评论(0) 推荐(1)
摘要:在Stanford parser目录中已经定义了一部分命令行工具以及图形界面,本文将介绍如何在windows使用这些工具进行语法分析,Linux下也有shell可以使用。 关于如何搭建环境请参考上一篇文章:Standford Parser学习入门(1)-Eclipse中配置 阅读全文
posted @ 2016-04-29 11:29 大刀客 阅读(1245) 评论(0) 推荐(0)
摘要:Stanford Parser是斯坦福大学研发的用于语法分析的工具,属于stanford nlp系列工具之一。本文主要介绍Standfor Parser的入门用法。 (ROOT (S (NP (DT The) (JJ quick) (JJ brown) (NN fox)) (VP (VBD jump 阅读全文
posted @ 2016-04-29 11:06 大刀客 阅读(2061) 评论(0) 推荐(0)