随笔分类 - ML
Machine Learning
摘要:在运行Stanford CoreNLP过程中会用到tokenize,pos等参数,这些以常量形式定义在edu.stanford.nlp.pipeline.Annotator中,具体如下: /** * These are annotators which StanfordCoreNLP knows h
阅读全文
摘要:分句功能参考 Stanford Tokenizer。 在edu.stanford.nlp.pipeline包中实现了一系列分词分句功能,其中SentenceAnnotator类实现了对文件分句功能. 运行Demo程序:在edu.stanford.nlp.pipeline.demo包中找到Stanfo
阅读全文
摘要:Standford Named Entities Recognizer(NER),命名实体识别是信息提取(Information Extraction)的一个子任务,它把文字的原子元素(Atomic Element)定位和分类好,然后输出为固定格式的目录,例如: 人名、组织、位置、时间的表示、数量、
阅读全文
摘要:Stanford CoreNLP Part Of Speech简称POS,主要是对待分析的句子中的单词进行标记的功能,如标记名词、动词等,该组件是CoreNLP工程的一部分,详细内容可参考:CoreNLP POS,使用POS
阅读全文
摘要:Stanford CoreNLP功能之一是Sentiment Analysis(情感分析),可以标识出语句的正面或者负面情绪,包括:Positive,Neutral,Negative三个值。 运行有两种方式:命令行和Eclipse运行,两种方式都需要编译源代码,源码可以在http://stanfor
阅读全文
摘要:Standford CoreNLP包含很多功能,github上有源码,github地址:Stanford CoreNLP,有需要的话可以下载看看。 主要内容在网站上都有描述,原文是这样写的: Choose Stanford CoreNLP if you need: An integrated too
阅读全文
摘要:以下是Stanford parser中的标记中文释义供参考。 probabilistic context-free grammar(PCFG) ROOT:要处理文本的语句 IP:简单从句 NP:名词短语 VP:动词短语 PU:断句符,通常是句号、问号、感叹号等标点符号 LCP:方位词短语 PP:介词
阅读全文
摘要:在Stanford parser目录中已经定义了一部分命令行工具以及图形界面,本文将介绍如何在windows使用这些工具进行语法分析,Linux下也有shell可以使用。 关于如何搭建环境请参考上一篇文章:Standford Parser学习入门(1)-Eclipse中配置
阅读全文
摘要:Stanford Parser是斯坦福大学研发的用于语法分析的工具,属于stanford nlp系列工具之一。本文主要介绍Standfor Parser的入门用法。 (ROOT (S (NP (DT The) (JJ quick) (JJ brown) (NN fox)) (VP (VBD jump
阅读全文

浙公网安备 33010602011771号