论文 Text Emotion Distribution Learning via Multi-Task Convolutional Neural Network

摘要

采用端到端的框架同时优化文本情感的 分布预测和分类

同时采用了一种 基于词典 的策略从 单一的标签(a single label)文本中生成情感分布,提供先验信息。

5个数据集(SemEval, Fairy Tales, ISEAR, TEC, CBET)

介绍

情感分析的意义

 单一标签分类 (single-label learning (SLL) problem),主导情感。其中 (1)利用里面的包含情感的词,它对应的情感标签(2)利用已经存在的机器学习分类器识别情感。

多标签学习 (multi-label learning (MLL))。设定阈值,分配情感( > threshold )

二者均无法体现一个句子中的多种情绪的占比程度。


 

本文想采用 标签分布学习 (label distribution learning (LDL))解决此问题。

模型:多任务CNN

损失函数:交叉熵和KL

训练数据:分布数据:SemEval   单标签数据: ISEAR, Fairy Tales, TEC, CBET


 

句子  情感分布

词向量矩阵  + CNN  => Loss (SGD) '

CNN:

输入层:一个句子,每个词语用一个词向量表示,k x M 矩阵 (M为词的个数)

卷积层: filter  h x k 矩阵    

posted @ 2019-12-11 22:10  loveyixuan  阅读(499)  评论(0)    收藏  举报