摘要: MySQL数据库命令大全 --数据库操作前的准备-- 创建数据库-- create database python_test_1 charset=utf8; -- 使用数据库-- use python_test_1; -- students表-- create table students(-- i 阅读全文
posted @ 2020-09-28 10:44 在代码的道路上倔强 阅读(90) 评论(0) 推荐(0)
摘要: (待重新编辑) 一、本文主要内容 实体识别的目标是将表层形式(surface form:实体的助记符号)映射到实体(entity:客观存在的事物),并标注实体的类型(人名、地名、组织名等),但是当文档数量越来越多的时候,表层形式的语义歧义问题就越来越突出了。 1998年Bagga和Baldwin提出 阅读全文
posted @ 2020-04-21 21:10 在代码的道路上倔强 阅读(342) 评论(0) 推荐(0)
摘要: 一、本文主要内容--自动CWS与NER研究(Chinese Word Segmentation (CWS)) 还是老生常谈,英文有空格分词,有明显的边界,而中文没有,句子是一串字符,需要做分词。所以,在对中文做任务的方面,第一步就是识别句子序列标记边界,也就是中文单词分割(CWS)。本文觉得,虽然有 阅读全文
posted @ 2020-04-14 20:34 在代码的道路上倔强 阅读(219) 评论(0) 推荐(0)
摘要: 一、本文主要内容 中文的命名实体识别的一个双向LSTM-CRF模型,作者找到了最适合中文的LSTM block块, 汉语中存在着较复杂的性质,如缺乏词界、复杂的构成形式、不确定长度、NE嵌套定义等,应用在CNER中的方法:最大熵、隐马尔可夫模型、支持向量机、条件随机场算法等。 基于字符的标记策略在没 阅读全文
posted @ 2020-04-14 14:07 在代码的道路上倔强 阅读(947) 评论(0) 推荐(0)
摘要: 一、本文主要内容 主要介绍了两中命名实体识别的模型,第一种是老生常谈的bi-LSTM-CRF模型,这个在论文的实践领域中,已经有很多改进的方法,比如添加字符级别的嵌入,加入attention机制等等,第二种是一个目前我还未读到的一个模型,Transition-Based Chunking Model 阅读全文
posted @ 2020-04-13 21:50 在代码的道路上倔强 阅读(1312) 评论(1) 推荐(1)
摘要: 一、论文主要内容 collobert 的那个联合训练,虽然提出了神经网络,但仅仅是一个简单的前向反馈网络,抛弃了上下文长距离的依赖,仅仅依赖与窗口大小之内的单词依赖,其次,由于仅仅依赖于单词嵌入,它无法利用明确的字符级别特征,如前缀和后缀,这可能很有用,特别是在单词嵌入的罕见单词中。 一个新模型:b 阅读全文
posted @ 2020-04-11 15:16 在代码的道路上倔强 阅读(739) 评论(0) 推荐(0)
摘要: 一、本文主要内容 1、(语标代替字母)问题:(1)中文命名实体识别中存在拼写错误、新词、不符合语法的结构;(2)缺乏明确的边界;(3)词切分糟糕;(4)典型的语料库只使用简体或繁体,但是社交媒体是混合的;(5)基于word的embedding,并不能在下游任务中有用; 2、先前技术:(1)CRF w 阅读全文
posted @ 2020-04-10 11:58 在代码的道路上倔强 阅读(543) 评论(0) 推荐(1)
摘要: 一、本文主要内容 1、作者用character and position embedding,即对每一个在词的不同位置中出现的字训练一个字向量,如“北京”和“京都”,这两个“京”字的embedding是不同的,前者是京2,后者是京1;作者用到的联合训练的方式,即将训练词向量的目标函数与命名实体识别任 阅读全文
posted @ 2020-04-09 22:06 在代码的道路上倔强 阅读(538) 评论(0) 推荐(0)
摘要: 一、本文中心内容 神经网络语言模型和词嵌入的经典论文,核心目标是将训练好的word embedding去完成词性标注(POS)、分块(短语识别CHUNK)、命名实体识别(NER)和语义角色标注(SRL)等任务,并且,本网络的语言模型只用来预训练word embedding,然后将其作为具体任务(任务 阅读全文
posted @ 2020-04-09 15:30 在代码的道路上倔强 阅读(1464) 评论(1) 推荐(1)
摘要: 因为我已经安装好了VM,所以我就直接安装Ubuntu了。 1、Ubuntu安装步骤 首先在各大镜像链接中下载ubuntu镜像文件,下载最新版本的就行 国内开源镜像: 阿里云: http://mirrors.aliyun.com/ 中科大: http://mirrors.ustc.edu.cn/ 其次 阅读全文
posted @ 2019-07-16 17:02 在代码的道路上倔强 阅读(293) 评论(0) 推荐(0)