摘要:
一、本文主要内容--自动CWS与NER研究(Chinese Word Segmentation (CWS)) 还是老生常谈,英文有空格分词,有明显的边界,而中文没有,句子是一串字符,需要做分词。所以,在对中文做任务的方面,第一步就是识别句子序列标记边界,也就是中文单词分割(CWS)。本文觉得,虽然有 阅读全文
posted @ 2020-04-14 20:34
在代码的道路上倔强
阅读(220)
评论(0)
推荐(0)
摘要:
一、本文主要内容 中文的命名实体识别的一个双向LSTM-CRF模型,作者找到了最适合中文的LSTM block块, 汉语中存在着较复杂的性质,如缺乏词界、复杂的构成形式、不确定长度、NE嵌套定义等,应用在CNER中的方法:最大熵、隐马尔可夫模型、支持向量机、条件随机场算法等。 基于字符的标记策略在没 阅读全文
posted @ 2020-04-14 14:07
在代码的道路上倔强
阅读(947)
评论(0)
推荐(0)

浙公网安备 33010602011771号