关于Generating aspect-oriented Muti-Document Document summarization with event-aspect model
摘要:这篇文章明天要开会讨论,还是先看吧。。1、文章讨论的是基于话题的多文档文摘,作者首先借助LDA主题模型对句子进行聚类,然后使用LexRank算法对各个聚簇中的句子进行排序,最后应用线性判选取句子。这里面比较特别的是,他在对句子进行打分以后,对于候选句子进行一次修剪工作,并且他用的不是句子语法树,而是对这个方法进行了一些细致的改进。2、文章的三个功能:a、相似意义语句的聚簇。b、基于随机游走模型的句子排序(LexRank不懂)c、提出一种新的句子压缩算法,有别于句法树。3、局域话题文摘的三个应用:a、生成类似于维基百科那样的东东,给出一个东东各个方面的简介。b、对于一个问题不同人有不同的观点,抽
阅读全文
posted @ 2012-06-28 20:00
浙公网安备 33010602011771号