摘要: spaCy 是一个号称工业级的自然语言处理工具包,最核心的数据结构是Doc和Vocab。Doc对象包含Token的序列和Token的注释(Annotation),Vocab对象是spaCy使用的词汇表(vocabulary),用于存储语言中共享的数据,spaCy通过集中存储字符串,单词向量和词汇属性 阅读全文
posted @ 2019-05-10 10:06 悦光阴 阅读(8562) 评论(0) 推荐(4) 编辑