这几天读的几篇文章
1. The Strength of Weak Learnability
提出了boost的思想,当有多个分类器的时候,不断地使用判断错误的训练集训练,并且调整不同分类器的比重,从而组合成一个更强的训练集。
最重要的一个定理
THEOREM: A concept class C is weakly learnable if and only if it is strongly learnable.
这个定理也直接导致了后来非常有名的AdaBoost.
2. TEDI: Efficient Shortest Path Query Answering on Graphs
精彩,非常精彩,其索引的思想非常值得学习。
使用树分解,将图中的最短路求解变成了树上的最近公共祖先问题。并且由于树分解的可伸缩性,可以根据空间的大小和预处理时间限制,灵活的控制做索引的大小和时间。
3. gStore: Answering SPARQL Queries via Subgraph matching
工程性的文章。
由于节点和边是有色的,并且集合相当大,所以可以利用hash或者signature的方法进行剪枝。
4. Temporal Analysis of Web Search Query-Click Data
亮点在于通过每隔一段时间进行doc和query关系的二分图提取。或者说是第一个使用图模型分析doc和query关系的,是一个中规中矩的研究。
5. Structural Trend Analysis for Online Social Networks
发表于VLDB 2010,我觉得他们就是有数据,搞到了twitter的数据做了一些结构上的分析。定了两个评价标准。我觉得这个文章真没什么……
posted on 2011-09-18 19:46 schindlerlee 阅读(206) 评论(0) 编辑 收藏 举报