Finding Deceptive Opinion Spam by Any Stretch of the Imagination (11 ACL)
摘要:论文 Finding Deceptive Opinion Spam by Any Stretch of the Imagination(11 ACL)文章研究虚假的spam,第一个贡献就是标注了标准的虚假评论和真实评论各400篇,组成了800篇的gold-standard数据。数据的构造过程使用了AMT(Amazon Mechanical Turk),很严谨,很靠谱!作者是将spam识别看成一个二元分类问题,分别尝试了3种方法,并尝试了3种方法的融合(这个是第二个贡献)。第1种方法是通过文本的风格识别(Genre identification),特征是使用POS的频率;第2种方法是进行心理学的
阅读全文
posted @ 2012-02-01 11:20
浙公网安备 33010602011771号