在代码的道路上倔强

2020年9月28日

摘要： MySQL数据库命令大全 --数据库操作前的准备-- 创建数据库-- create database python_test_1 charset=utf8; -- 使用数据库-- use python_test_1; -- students表-- create table students(-- i 阅读全文

posted @ 2020-09-28 10:44 在代码的道路上倔强阅读(105) 评论(0) 推荐(0)

2020年4月21日

第八篇：Large-Scale Named Entity Disambiguation Based on Wikipedia Data

摘要：（待重新编辑）一、本文主要内容实体识别的目标是将表层形式（surface form：实体的助记符号）映射到实体（entity：客观存在的事物），并标注实体的类型（人名、地名、组织名等），但是当文档数量越来越多的时候，表层形式的语义歧义问题就越来越突出了。 1998年Bagga和Baldwin提出阅读全文

posted @ 2020-04-21 21:10 在代码的道路上倔强阅读(357) 评论(0) 推荐(0)

2020年4月14日

第七篇：An Empirical Study of Automatic Chinese Word Segmentation for Spoken Language Understanding and Named Entity Recognition

摘要：一、本文主要内容--自动CWS与NER研究（Chinese Word Segmentation (CWS)）还是老生常谈，英文有空格分词，有明显的边界，而中文没有，句子是一串字符，需要做分词。所以，在对中文做任务的方面，第一步就是识别句子序列标记边界，也就是中文单词分割（CWS）。本文觉得，虽然有阅读全文

posted @ 2020-04-14 20:34 在代码的道路上倔强阅读(234) 评论(0) 推荐(0)

第六篇：Character-Based LSTM-CRF with Radical-Level Features for Chinese Named Entity Recognition

摘要：一、本文主要内容中文的命名实体识别的一个双向LSTM-CRF模型，作者找到了最适合中文的LSTM block块，汉语中存在着较复杂的性质，如缺乏词界、复杂的构成形式、不确定长度、NE嵌套定义等，应用在CNER中的方法：最大熵、隐马尔可夫模型、支持向量机、条件随机场算法等。基于字符的标记策略在没阅读全文

posted @ 2020-04-14 14:07 在代码的道路上倔强阅读(967) 评论(0) 推荐(0)

2020年4月13日

第五篇：Neural Architectures for Named Entity Recognition

摘要：一、本文主要内容主要介绍了两中命名实体识别的模型，第一种是老生常谈的bi-LSTM-CRF模型，这个在论文的实践领域中，已经有很多改进的方法，比如添加字符级别的嵌入，加入attention机制等等，第二种是一个目前我还未读到的一个模型，Transition-Based Chunking Model 阅读全文

posted @ 2020-04-13 21:50 在代码的道路上倔强阅读(1328) 评论(1) 推荐(1)

2020年4月11日

第四篇：Named Entity Recognition with Bidirectional LSTM-CNNs

摘要：一、论文主要内容 collobert 的那个联合训练，虽然提出了神经网络，但仅仅是一个简单的前向反馈网络，抛弃了上下文长距离的依赖，仅仅依赖与窗口大小之内的单词依赖，其次，由于仅仅依赖于单词嵌入，它无法利用明确的字符级别特征，如前缀和后缀，这可能很有用，特别是在单词嵌入的罕见单词中。一个新模型：b 阅读全文

posted @ 2020-04-11 15:16 在代码的道路上倔强阅读(756) 评论(0) 推荐(0)

2020年4月10日

第三篇：Named Entity Recognition for Chinese Social Media with Jointly Trained Embeddings

摘要：一、本文主要内容 1、（语标代替字母）问题：（1）中文命名实体识别中存在拼写错误、新词、不符合语法的结构；（2）缺乏明确的边界；（3）词切分糟糕；（4）典型的语料库只使用简体或繁体，但是社交媒体是混合的；（5）基于word的embedding，并不能在下游任务中有用； 2、先前技术：（1）CRF w 阅读全文

posted @ 2020-04-10 11:58 在代码的道路上倔强阅读(577) 评论(0) 推荐(1)

2020年4月9日

第二篇：Improving Named Entity Recognition for Chinese Social Media with Word Segmentation Representation Learning

摘要：一、本文主要内容 1、作者用character and position embedding，即对每一个在词的不同位置中出现的字训练一个字向量，如“北京”和“京都”，这两个“京”字的embedding是不同的，前者是京2，后者是京1；作者用到的联合训练的方式，即将训练词向量的目标函数与命名实体识别任阅读全文

posted @ 2020-04-09 22:06 在代码的道路上倔强阅读(554) 评论(0) 推荐(0)

第一篇：Natural Language Processing (Almost) from Scratch

摘要：一、本文中心内容神经网络语言模型和词嵌入的经典论文，核心目标是将训练好的word embedding去完成词性标注（POS）、分块（短语识别CHUNK）、命名实体识别（NER）和语义角色标注（SRL）等任务，并且，本网络的语言模型只用来预训练word embedding，然后将其作为具体任务（任务阅读全文

posted @ 2020-04-09 15:30 在代码的道路上倔强阅读(1478) 评论(1) 推荐(1)

2019年7月16日

python的第三篇--安装Ubuntu、pycharm

摘要：因为我已经安装好了VM，所以我就直接安装Ubuntu了。 1、Ubuntu安装步骤首先在各大镜像链接中下载ubuntu镜像文件，下载最新版本的就行国内开源镜像: 阿里云: http://mirrors.aliyun.com/ 中科大: http://mirrors.ustc.edu.cn/ 其次阅读全文

posted @ 2019-07-16 17:02 在代码的道路上倔强阅读(303) 评论(0) 推荐(0)

在代码的道路上倔强

公告