自然语言处理 - 随笔分类 - JetHu

乱序语言模型XLNET的理解

摘要：1.在Transformer中实现单向语言模型如图所示，Attention矩阵的每一行事实上代表着输出，而每一列代表着输入，而Attention矩阵就表示输出和输入的关联。对于句子“北京欢迎你”，假定白色方格都代表0，那么第1行表示“北”只能跟起始标记<s>相关了，而第2行就表示“京”只能跟起始标记阅读全文

posted @ 2020-03-06 17:16 JetHu 阅读(933) 评论(0) 推荐(0)

开源知识图谱介绍

摘要：中文开源知识图谱：（1）中文通用百科知识图谱（CN-DBpedia）介绍 CN-DBpedia是由复旦大学知识工场实验室研发并维护的大规模通用领域结构化百科，其前身是复旦GDM中文知识图谱。 CN-DBpedia主要从中文百科类网站（如百度百科、互动百科、中文维基百科等）的纯文本页面中提取信息，阅读全文

posted @ 2020-02-18 19:40 JetHu 阅读(11466) 评论(0) 推荐(2)

CRF条件随机场基础理解（一）

摘要：CRF条件随机场条件随机场(Conditional Random Fields, 以下简称CRF)是给定一组输入序列条件下另一组输出序列的条件概率分布模型 1.什么样的问题需要CRF模型（1）我们有一个句子X=“我是中国公民” 需要对这句话中的四个词标注词性，最简单的方法就是拿一组标注好词阅读全文

posted @ 2020-02-16 11:54 JetHu 阅读(682) 评论(0) 推荐(0)

Knowledge-Augmented Language Model and its Application to Unsupervised Named-Entity Recognition（Facebook AI 2019）文献综述

摘要：Knowledge-Augmented Language Model and its Application to Unsupervised Named-Entity Recognition（Facebook AI 2019）文献综述 1.摘要：传统的语言模型无法为文本中的实体名称进行有效建模，阅读全文

posted @ 2020-02-08 10:51 JetHu 阅读(632) 评论(0) 推荐(0)

BERT+知识图谱： K-BERT Enabling Language Representation with Knowledge Graph 文献理解

摘要：参考文献：BERT+知识图谱：北大-腾讯联合推出知识赋能的K-BERT模型地址：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/103790278 此前两篇关于知识图谱结合预训练的文章作为了解： ERNIE: Enhanced Repr 阅读全文

posted @ 2020-02-07 19:42 JetHu 阅读(2249) 评论(0) 推荐(0)

中文新词发现相关算法调研

摘要：（一）专业领域的新词发现竞赛：“AIIA”杯-国家电网-电力专业领域词汇挖掘地址：https://www.datafountain.cn/competitions/320/datasets （二）新词发现，基于信息熵和词的凝合度算法（无预定义词库）参考文章：互联网时代的社会语言学：基于SNS的文阅读全文

posted @ 2020-02-07 18:05 JetHu 阅读(1463) 评论(0) 推荐(0)

win10 + 独显 + Anaconda3 + tensorflow_gpu1.13 安装教程（跑bert模型）

摘要：这里面有很多坑，最大的坑是发现各方面都装好了结果报错 Loaded runtime CuDNN library: 7.3.1 but source was compiled with: 7.4.1，这是由于最新的tensorflow1.13需要用 Cudnn7.4.1编译。这个问题，StackOve 阅读全文

posted @ 2019-05-09 12:15 JetHu 阅读(2784) 评论(0) 推荐(1)

word2vec 和 doc2vec 词向量表示

摘要：Word2Vec 词向量的稠密表达形式（无标签语料库训练） Word2vec中要到两个重要的模型，CBOW连续词袋模型和Skip-gram模型。两个模型都包含三层：输入层，投影层，输出层。 1.Skip-Gram神经网络模型（跳过一些词） skip-gram模型的输入是一个单词wI，它的输出是wI的阅读全文

posted @ 2018-09-06 21:42 JetHu 阅读(2249) 评论(0) 推荐(0)

Global Vectors forWord Representation

摘要：参考论文： GloVe: Global Vectors forWord Representation 参考博客：https://blog.csdn.net/coderTC/article/details/73864097 理解GloVe模型： glove 模型类似于word2vec模型，都是一种词的阅读全文

posted @ 2018-09-06 21:41 JetHu 阅读(277) 评论(0) 推荐(0)

Latent Semantic Analysis(LSA/ LSI)原理简介

摘要：LSA的工作原理： How Latent Semantic Analysis Works LSA被广泛用于文献检索，文本分类，垃圾邮件过滤，语言识别，模式检索以及文章评估自动化等场景。 LSA其中一个目的是解决如通过搜索词/关键词（search words）定位出相关文章。如何通过对比单词来定位文章阅读全文

posted @ 2018-09-03 17:46 JetHu 阅读(2290) 评论(0) 推荐(0)

目前最快速的多线程Kmeans算法，java实现

摘要：目前最快速Kmeans算法，并由java实现！面对很大的K值表现依然很好。代码地址： https://github.com/Jethu1/fastKmeans #1.这是一个由java实现的的，多线程Kmeans聚类算法； #2.在聚类的选种阶段分别实现了Kmeans++算法和NIPS 2016的阅读全文

posted @ 2018-07-26 20:23 JetHu 阅读(850) 评论(0) 推荐(0)

JetHu

随笔分类 - 自然语言处理

公告