12 2010 档案

摘要:今天跑程序出了个大问题,闲话少叙,先上图:以上是我在今天的不同时间段截到的图。从图中可以很明显的看出,这个learnstruct结构学习库存在着严重的内存泄露问题。据估算,在程序运行前期,内存泄露的速度大约为每小时2%,随着程序运行时间的增长,内存泄露的越来越严重,到后来泄露速度达到了5%左右!而且结构学习本身是个很慢的过程,在大数据集上跑个几十个小时是很正常的事情。所以这个库的可用性有待于进一步考证。12-12工作安排:搭好140的工作环境计算AUC对比分析AUC实验结果和论文中的结果 阅读全文
posted @ 2010-12-11 22:44 centimeter 阅读(171) 评论(0) 推荐(0)
摘要:今天早上,我带着无限的期待,来到实验室,看昨晚的实验结果。很不错,webkb的all.mln已经学出来了!但是uw-cse的mln迟迟不见踪影。已经20几个小时了,也不知道是算法本身的问题,还是我们运行的有问题。等着吧!在用webkb学出来的all.mln向imdb2345迁移时出现了问题,提示文件打不开。我想原因可能是机器内存资源不足。因为我在查看服务器的资源时,发现uw-cse的结构学习进程耗费非常多的CPU和内存,估计存在着不是特别严重的内存泄露问题,之所以会在这个时候体现出来,是和uw-cse运行的时间长有关(单个进程就占用了1个多G的内存,这是前所未有的)。昨晚已经完成了从webkb 阅读全文
posted @ 2010-12-10 22:36 centimeter 阅读(197) 评论(0) 推荐(0)
摘要:今天的工作效率好低啊,究其原因,主要是目标不是很明确,总是在做些无用功。不过经过和wx的讨论,思路渐渐的明朗起来,目前主要的工作是这样的:1、将UW-CSE的五个数据集归结成一个总的数据集all.db,用这个总的db训练出一个mln;2、同理,将WEBKB的四个数据集归结成all.db,训练出WEBKB的mln;3、利用前两步得到的结果,向imdb数据集做结构迁移。注意,imdb中有五个数据集,需要依次以其中的一个作为测试集,其他的组合起来作为训练集,训练出目标域imdb的mln;4、利用目标域的mln和测试集进行Infer测试,得到每个谓词的出现概率;5、计算每个谓词的CLL和AUC。经过上 阅读全文
posted @ 2010-12-09 22:36 centimeter 阅读(208) 评论(0) 推荐(0)
摘要:按照tamar的操作步骤,在uw-cse和webkb数据集上进行了实验,完成了前两个步骤,即:在只有谓词的空mln的基础上,进行了结构学习,生成了完整的mln,以备后用。但是程序跑的很慢,运行一次要几个小时,目前还没有跑出结果,但愿明天早上能给我个惊喜。12-9日工作安排:进行tamar实验的第三和第四个步骤:从uw-cse和webkb数据集向imdb数据集进行迁移学习,并利用迁移学习出的mln进行推断。注意,推断时要用MC-SAT算法(参数为-ms)。打羽毛球,锻炼身体如果实验跑的快的话,就计算出CLL。 阅读全文
posted @ 2010-12-08 22:19 centimeter 阅读(227) 评论(1) 推荐(0)
摘要:稀里糊涂的竟然搞起了机器学习,不过既然做了就要做好。  这段时间读了很多关于迁移学习和马尔可夫逻辑网(markov logic network)的论文,其中比较重要的一篇文章是Lilyana Mihalkova的《Mapping and Revising Markov Logic Networks for Transfer Learning》,现在正在跑这篇文章附带的tamar(for Transfer via Automatic Mapping And Revision)系统,现简要总结一下该系统的使用步骤:1、利用源域的db文件和空的mln文件(其中包含所有的谓词),学习出源域的结构(le 阅读全文
posted @ 2010-12-08 18:35 centimeter 阅读(362) 评论(0) 推荐(0)
摘要:为了便于以后查看,现将12月7日的工作总结如下:  今天完成的主要工作分为两个方面:  实验方面:学习了perl的一些关于文件的语法,写了几个简单的小程序,成功的完成了cora到imdb的迁移及推断。由于推断需要的时间较长,所以只先做了两三个谓词的推断,但是效果很不理想。预期的实验效果应该是这样的:对于原始的db文件中出现过的谓词,在预测的出的结果文件中应该表现出较高的概率,但是经实验发现,所有的基谓词的概率并没有明显的差别。  实验结果分析:这种结果的产生我认为主要有两种可能:一种是由于只跑了两三个谓词,所以结果不具有代表性,个别谓词的推断对整体性能不会造成太大打的影响。另一种可能是采用的推 阅读全文
posted @ 2010-12-08 18:23 centimeter 阅读(216) 评论(0) 推荐(0)