2013.5.23 - KDD第三十五天

Posted on 2014-02-17 19:09  SnakeHunt2012  阅读(238)  评论(0)    收藏  举报
看完睡不觉得世间有点虚度,然后就构思了一下带带回儿去找中秋要跟她说的事情,大概就是这样的:
 
我 打算用paper来计算人与人之间的距离,比如说我跟郑茂和写过一篇文章,然后郑茂根韩冰和写过一篇文章,这样我跟韩冰的距离比较近,这样如果我在一篇文 章中跟其他两个id有名称歧义的话而且其中韩冰又是其中一个无歧义作者,那没看我这个id跟韩冰这么近,肯定是我写的文章。
 
晚 上八点多快九点的时候给中求发短信,然后他说现在可以过去,我就过去了。过去之后我跟她说了这个想法没他说有问题,具体问题就是我是我们最初的想法是正确 的,后来改的不对,而且基本上不能对着id来弄。他觉得官方给的validit数据本身就是内涵bug的,在里面他已经相当于把答案放进去了,应该是给数 据的时候出的问题,然后他用正则表达式等一些方法就能直接从vaidit中识别出来,他用这个方法就已经跑到了九十多,不过事实上不能这么干,他认为现在 榜单上作出就是多的基本上都是这么做的,最后给的test集应该不会是这样。
 
现在已经把簇都已经聚好了,我现在最后的问题就是怎么给簇指派,初步想法就是在类里面如果能找到跟要是别的作者的机构相同机构的协作者,那么这个类就是他的,而且找到的相同机构越多,越往前排列。
 
而 我的任务是通过人关系,主要是从协作关系中挖掘出来的人际关系来确定这个簇的指派。