文献阅读梳理

Finding Core Topics: Topic Extraction with Clustering on Tweet

挺水的文章,其中的借鉴可以是:

1)以转发数作为微博质量的衡量标准,区分高质量微博和垃圾微博(或许可以综合考虑评论,转发,赞的数目?)

2)通过聚类的方法进行话题提取,种子的选取是提取双引号以内的,以及首字母大写的。

3)没有定量的评价,可以看看其如何进行定性的评价

SEARCHINGTELEVISIONFRAGMENTSUSING MICRO-BLOGS: WHO IS ON#DWDDAND
WHAT DO THETWEETSREPORT?

1)n-gram结合tf-idf,结合微博自身的hashtag进行话题提取。

On the Generation of Rich Content Metadata from Social Media

这篇文章解决了两个任务,就这一点来看如果自己论文分为两步:filtering 和 analysis的时候或许具有借鉴意义。

 Towards an effective identification of microblog messages for social tv

 

posted @ 2014-03-09 20:52  bobo的学习笔记  阅读(197)  评论(0编辑  收藏  举报