这几天读的几篇文章

1.       The Strength of Weak Learnability

提出了boost的思想,当有多个分类器的时候,不断地使用判断错误的训练集训练,并且调整不同分类器的比重,从而组合成一个更强的训练集。

最重要的一个定理

THEOREM:  A concept class C is weakly learnable if and only if it is strongly learnable.

这个定理也直接导致了后来非常有名的AdaBoost.

 

2.      TEDI: Efficient Shortest Path Query Answering on Graphs

精彩,非常精彩,其索引的思想非常值得学习。

使用树分解,将图中的最短路求解变成了树上的最近公共祖先问题。并且由于树分解的可伸缩性,可以根据空间的大小和预处理时间限制,灵活的控制做索引的大小和时间。

 

3.      gStore: Answering SPARQL Queries via Subgraph matching

工程性的文章。

由于节点和边是有色的,并且集合相当大,所以可以利用hash或者signature的方法进行剪枝。

 

4.      Temporal Analysis of Web Search Query-Click Data

亮点在于通过每隔一段时间进行docquery关系的二分图提取。或者说是第一个使用图模型分析docquery关系的,是一个中规中矩的研究。

 

5.      Structural Trend Analysis for Online Social Networks

发表于VLDB 2010,我觉得他们就是有数据,搞到了twitter的数据做了一些结构上的分析。定了两个评价标准。我觉得这个文章真没什么……

 

 

posted on 2011-09-18 19:46  schindlerlee  阅读(206)  评论(0编辑  收藏  举报