会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
在代码的道路上倔强
博客园
首页
新随笔
联系
订阅
管理
2020年9月28日
数据库MYSQL
摘要: MySQL数据库命令大全 --数据库操作前的准备-- 创建数据库-- create database python_test_1 charset=utf8; -- 使用数据库-- use python_test_1; -- students表-- create table students(-- i
阅读全文
posted @ 2020-09-28 10:44 在代码的道路上倔强
阅读(90)
评论(0)
推荐(0)
2020年4月21日
第八篇:Large-Scale Named Entity Disambiguation Based on Wikipedia Data
摘要: (待重新编辑) 一、本文主要内容 实体识别的目标是将表层形式(surface form:实体的助记符号)映射到实体(entity:客观存在的事物),并标注实体的类型(人名、地名、组织名等),但是当文档数量越来越多的时候,表层形式的语义歧义问题就越来越突出了。 1998年Bagga和Baldwin提出
阅读全文
posted @ 2020-04-21 21:10 在代码的道路上倔强
阅读(342)
评论(0)
推荐(0)
2020年4月14日
第七篇:An Empirical Study of Automatic Chinese Word Segmentation for Spoken Language Understanding and Named Entity Recognition
摘要: 一、本文主要内容--自动CWS与NER研究(Chinese Word Segmentation (CWS)) 还是老生常谈,英文有空格分词,有明显的边界,而中文没有,句子是一串字符,需要做分词。所以,在对中文做任务的方面,第一步就是识别句子序列标记边界,也就是中文单词分割(CWS)。本文觉得,虽然有
阅读全文
posted @ 2020-04-14 20:34 在代码的道路上倔强
阅读(219)
评论(0)
推荐(0)
第六篇:Character-Based LSTM-CRF with Radical-Level Features for Chinese Named Entity Recognition
摘要: 一、本文主要内容 中文的命名实体识别的一个双向LSTM-CRF模型,作者找到了最适合中文的LSTM block块, 汉语中存在着较复杂的性质,如缺乏词界、复杂的构成形式、不确定长度、NE嵌套定义等,应用在CNER中的方法:最大熵、隐马尔可夫模型、支持向量机、条件随机场算法等。 基于字符的标记策略在没
阅读全文
posted @ 2020-04-14 14:07 在代码的道路上倔强
阅读(947)
评论(0)
推荐(0)
2020年4月13日
第五篇:Neural Architectures for Named Entity Recognition
摘要: 一、本文主要内容 主要介绍了两中命名实体识别的模型,第一种是老生常谈的bi-LSTM-CRF模型,这个在论文的实践领域中,已经有很多改进的方法,比如添加字符级别的嵌入,加入attention机制等等,第二种是一个目前我还未读到的一个模型,Transition-Based Chunking Model
阅读全文
posted @ 2020-04-13 21:50 在代码的道路上倔强
阅读(1312)
评论(1)
推荐(1)
2020年4月11日
第四篇:Named Entity Recognition with Bidirectional LSTM-CNNs
摘要: 一、论文主要内容 collobert 的那个联合训练,虽然提出了神经网络,但仅仅是一个简单的前向反馈网络,抛弃了上下文长距离的依赖,仅仅依赖与窗口大小之内的单词依赖,其次,由于仅仅依赖于单词嵌入,它无法利用明确的字符级别特征,如前缀和后缀,这可能很有用,特别是在单词嵌入的罕见单词中。 一个新模型:b
阅读全文
posted @ 2020-04-11 15:16 在代码的道路上倔强
阅读(739)
评论(0)
推荐(0)
2020年4月10日
第三篇:Named Entity Recognition for Chinese Social Media with Jointly Trained Embeddings
摘要: 一、本文主要内容 1、(语标代替字母)问题:(1)中文命名实体识别中存在拼写错误、新词、不符合语法的结构;(2)缺乏明确的边界;(3)词切分糟糕;(4)典型的语料库只使用简体或繁体,但是社交媒体是混合的;(5)基于word的embedding,并不能在下游任务中有用; 2、先前技术:(1)CRF w
阅读全文
posted @ 2020-04-10 11:58 在代码的道路上倔强
阅读(543)
评论(0)
推荐(1)
2020年4月9日
第二篇:Improving Named Entity Recognition for Chinese Social Media with Word Segmentation Representation Learning
摘要: 一、本文主要内容 1、作者用character and position embedding,即对每一个在词的不同位置中出现的字训练一个字向量,如“北京”和“京都”,这两个“京”字的embedding是不同的,前者是京2,后者是京1;作者用到的联合训练的方式,即将训练词向量的目标函数与命名实体识别任
阅读全文
posted @ 2020-04-09 22:06 在代码的道路上倔强
阅读(538)
评论(0)
推荐(0)
第一篇:Natural Language Processing (Almost) from Scratch
摘要: 一、本文中心内容 神经网络语言模型和词嵌入的经典论文,核心目标是将训练好的word embedding去完成词性标注(POS)、分块(短语识别CHUNK)、命名实体识别(NER)和语义角色标注(SRL)等任务,并且,本网络的语言模型只用来预训练word embedding,然后将其作为具体任务(任务
阅读全文
posted @ 2020-04-09 15:30 在代码的道路上倔强
阅读(1464)
评论(1)
推荐(1)
2019年7月16日
python的第三篇--安装Ubuntu、pycharm
摘要: 因为我已经安装好了VM,所以我就直接安装Ubuntu了。 1、Ubuntu安装步骤 首先在各大镜像链接中下载ubuntu镜像文件,下载最新版本的就行 国内开源镜像: 阿里云: http://mirrors.aliyun.com/ 中科大: http://mirrors.ustc.edu.cn/ 其次
阅读全文
posted @ 2019-07-16 17:02 在代码的道路上倔强
阅读(293)
评论(0)
推荐(0)
下一页
公告