摘要: GENIA语料库:http://www.nactem.ac.uk/genia/genia-corpusGENIA corpus The GENIA corpus is the primary collection of biomedical literature compiled and annotated within the scope of the GENIA project. The corpus was created to support the development and evaluation of information extraction and text mining 阅读全文
posted @ 2012-10-28 10:54 ZH奶酪 阅读(3155) 评论(0) 推荐(1) 编辑
摘要: 语料库包含一定篇目(语篇),每篇篇目包含一定量的词汇。语种:单语种语料库,多语种语料库;记载媒体:单媒体语料库,多媒体语料库;地域:国家语料库,国际语料库;以语料库代表性和平衡性为主要区分依据的:平衡语料库,平行语料库;平衡性好坏取决于语料库中语料的使用度是否可以真实反映语言使用情况。平行型表现为语料选取的时间、对象、比例、文本数、文本长度等几乎一致(一般用于机器翻译)。以语料库用途为主要区分依据的:通用语料库,专用语料库;(二者是相对的)以语料分布时间为主要区分依据的:共时语料库,历时语料库;按照索绪尔的观点,共时研究是研究大树的横断面所见的细胞和细胞关系,即研究一个共时平面中的元素与元素的 阅读全文
posted @ 2012-10-28 10:08 ZH奶酪 阅读(852) 评论(0) 推荐(0) 编辑
摘要: 【“推出”符号在这里显示为à,可能是编码问题】1、 图(本质上是二元关系):无向图、有向图、连通图、回路2、 树3、 字符串a) 字符串:字符集和Σ、字符串、空串ε、全体字符串Σ*b) 字符串连接:例如:Σ={a,b,c}, x=abc,y=cba,x和y的连接xy=abccba,x的2次方幂x2 ... 阅读全文
posted @ 2012-10-28 10:07 ZH奶酪 阅读(1282) 评论(0) 推荐(0) 编辑
摘要: Host page: http://www.nactem.ac.uk/genia/Home 主页Welcome to the new homepage of the GENIA Project!欢迎来到GENIA项目的新主页。The GENIA Project was founded by prof. Jun'ichi Tsujii and ran at the Tsujii Laboratory of University of Tokyo from 1998 to 2012. A full list of project members and support can be fou 阅读全文
posted @ 2012-10-28 10:05 ZH奶酪 阅读(429) 评论(0) 推荐(0) 编辑