论文 Text Emotion Distribution Learning via Multi-Task Convolutional Neural Network
摘要
采用端到端的框架同时优化文本情感的 分布预测和分类。
同时采用了一种 基于词典 的策略从 单一的标签(a single label)文本中生成情感分布,提供先验信息。
5个数据集(SemEval, Fairy Tales, ISEAR, TEC, CBET)
介绍
情感分析的意义
单一标签分类 (single-label learning (SLL) problem),主导情感。其中 (1)利用里面的包含情感的词,它对应的情感标签(2)利用已经存在的机器学习分类器识别情感。
多标签学习 (multi-label learning (MLL))。设定阈值,分配情感( > threshold )
二者均无法体现一个句子中的多种情绪的占比程度。
本文想采用 标签分布学习 (label distribution learning (LDL))解决此问题。
模型:多任务CNN
损失函数:交叉熵和KL
训练数据:分布数据:SemEval 单标签数据: ISEAR, Fairy Tales, TEC, CBET
句子 情感分布
词向量矩阵 + CNN => Loss (SGD) '
CNN:
输入层:一个句子,每个词语用一个词向量表示,k x M 矩阵 (M为词的个数)
卷积层: filter h x k 矩阵

浙公网安备 33010602011771号