02 2020 档案
摘要:中文开源知识图谱: (1)中文通用百科知识图谱(CN-DBpedia) 介绍 CN-DBpedia是由复旦大学知识工场实验室研发并维护的大规模通用领域结构化百科,其前身是复旦GDM中文知识图谱。 CN-DBpedia主要从中文百科类网站(如百度百科、互动百科、中文维基百科等)的纯文本页面中提取信息,
阅读全文
摘要:CRF条件随机场 条件随机场(Conditional Random Fields, 以下简称CRF)是给定一组输入序列条件下另一组输出序列的条件概率分布模型 1.什么样的问题需要CRF模型 (1)我们有一个句子X=“我 是 中国 公民” 需要对这句话中的四个词标注词性,最简单的方法就是拿一组标注好词
阅读全文
摘要:Knowledge-Augmented Language Model and its Application to Unsupervised Named-Entity Recognition(Facebook AI 2019) 文献综述 1.摘要: 传统的语言模型无法为文本中的实体名称进行有效建模,
阅读全文
摘要:参考文献:BERT+知识图谱:北大-腾讯联合推出知识赋能的K-BERT模型 地址:https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/103790278 此前两篇关于知识图谱结合预训练的文章作为了解: ERNIE: Enhanced Repr
阅读全文
摘要:(一)专业领域的新词发现竞赛:“AIIA”杯-国家电网-电力专业领域词汇挖掘 地址:https://www.datafountain.cn/competitions/320/datasets (二)新词发现,基于信息熵和词的凝合度算法(无预定义词库) 参考文章:互联网时代的社会语言学:基于SNS的文
阅读全文

浙公网安备 33010602011771号