06 2022 档案
Open-Domain Targeted Sentiment Analysis via Span-Based Extraction and Classification基于Span的开放域情感提取与分类
摘要:摘要 面向开放域的情感分析旨在从句子中检测意见目标及其情感极性。之前的工作通常将此任务描述为序列标记问题。然而,该公式存在搜索空间大、情感不一致等问题。为了解决这些问题,我们提出了一个基于广度的抽取-再分类框架,在目标span边界的监督下,直接从句子中抽取多个观点目标,然后使用它们span表示对相应 阅读全文
posted @ 2022-06-16 16:21 啥123
文本全角与半角字符的转换
摘要:全角字符有两种: 空格:它的全角值十进制整数为12288,十六进制为0x3000,而其半角十进制整数值为32,十六进制结果为0x20. 有规律的字符:这类字符的全角十进制整数范围为[65281,65374],十六进制[0xFF01,0xFF5E],半角十进制整数值[33,126],十六进制[0x21 阅读全文
posted @ 2022-06-13 09:45 啥123 阅读(911) 评论(0) 推荐(0)
Dependency-Guided LSTM-CRF for Named Entity Recognition
摘要:基于依赖关系的LSTM-CRF的命名实体识别 摘要 依赖树结构捕捉句子中单词之间的远距离和句法关系。句法关系(例如,名词主语、宾语)可能推断出某些命名实体的存在。此外,命名实体识别器的性能还可以受益于依赖树中单词之间的长距离依赖关系。在这项工作中,我们提出了一个简单而有效的依赖导向LSTM-CRF模 阅读全文
posted @ 2022-06-08 16:17 啥123 阅读(314) 评论(0) 推荐(0)
FLAT Flat-Lattice-Transformer收获
摘要:论文整体使用了transformer的编码层,对于自注意力的计算方式进行了改变,引入了相对位置编码。 主要创新点: 将lattice-LSTM中词的图结构信息给“拉平”成统一的序列输入,从而解决了LSTM无法高效并行,而transformer具有更强的语义和长依赖的编码能力。 引入相对位置编码,这个 阅读全文
posted @ 2022-06-05 12:04 啥123 阅读(88) 评论(0) 推荐(0)