由随机游走模型说起

随机游走模型可以预测不同节点之间的潜在关系,如下面图的例子: 在上图中,q表示为查询,d表示为文档,如果有直线相连,就表示相关,q1和d1,d2相连,则d1和d2都是q1的相关文档,但是d3没有和q1相连(实线),那么他们之间就没有关系了么?不是的,通过与q2相关的文档发现,d3和q1是有关系的,原因是d1,d2和d3与q2都相关,那么他们之间是有关系的。这个查询和文档组成的网络中,相关的关系,是可以传递的,这个是比较重要的。 上面是随机游走的一个例子,至于例子背后的原理,这正是我12年上半年要深入了解的东西。对于随机游走模型求解,我目前知道两种方法,一种是将图表示为矩阵,然后矩阵自乘知道收敛,矩阵中的值,就是关系的程度了;另一种是基于图的计算,判断是否连通,以及连通的距离等。这些方法也需要进一步的研究、深入。 打算深入随机游走模型和复杂网络,主要的动机是我正在做微博数据挖掘的工作,是我目前的主要兴趣,挖掘的目标就是微博关注的关系。已经有一些基于图的naive的方法,需要在理论上进一步加深。另外,今年kdd的第一个task就是微博数据挖掘,目标是推荐微博用户潜在的关注对象。这个问题,我之间有深入考虑过,而且实现一个效率比较低的方法,但是准确度非常高。基本思想就是发现有重叠的社团结构,将这个作为基础,寻找差异,差异的结果就可以作为推荐。最核心,也最基础的就是,要准确的找到社团结构。我想通过对复杂网络的理解和研究,改进算法,应该能有个漂亮的结果,所以,打算参加一下kdd,以弥补我硕士三年的遗憾。 【引用】
 http://book.51cto.com/art/201107/276845.htm

posted on 2012-01-17 14:39  sing1ee  阅读(3346)  评论(0)    收藏  举报