随笔分类 -  Software Analysis and Mining

摘要:Abstract大数据的克隆检测和搜索算法已经作为嵌入在应用中的一部分.本文推出一个代码检测基准.包含一些已知的真假克隆代码.其中包括600万条真克隆(包含type-1,type-2,type-3,type-4).S1 IntroductionIJaDataset 2.0包含25,000个系统,36... 阅读全文
posted @ 2015-05-22 11:21 max_xbw 阅读(822) 评论(4) 推荐(0)
摘要:abstract: 代码克隆的综述S1 INTRODUCTION AND MOTIVATION代码克隆的利弊: 利:可以有效地去耦合,避免其他一些可能的错误; 弊:当被复制的那段code中带有bug的话,他的复制版本中都会含有bug。但是代码克隆操作又是不可避免的,因此,代码克隆应该得到有效的检测和... 阅读全文
posted @ 2015-05-13 15:37 max_xbw 阅读(376) 评论(0) 推荐(0)
摘要:摘要: 利用软件中的历史缺陷数据来建立分类器,进行软件缺陷的检测。 多核学习(Multiple kernel learning):把历史缺陷数据映射到高维特征空间,使得数据能够更好地表达; 集成学习(ensemble learning):使用一系列的分类器来减少由主类带来的分类误差,使具有更好的检测结果。 本文采用集成学习的方法构建一个多核... 阅读全文
posted @ 2015-05-10 16:53 max_xbw 阅读(1645) 评论(0) 推荐(0)
摘要:摘要: 本文主要是评估多种监督机器学习算法的有效性,这些算法用于判断一个错误报告是否是reopened的,算法如下: 7种监督学习算法:kNN,SVM, SimpleLogistic,Bayesian Network, Decision Table, CARTand LWL; 3种集成学习算法: AdaBoost,Bagging... 阅读全文
posted @ 2015-04-20 10:09 max_xbw 阅读(265) 评论(0) 推荐(0)
摘要:摘要: 目前有许多的bug定位技术,但是,由于他们基于不同的数据集,而且有些数据集还不是公开的,甚至有些技术只应用于小数据集,不具有通用性,因此,不好比较这些技术之间的优劣。 因此,BOAT应运而生。BOAT是指:Bug lOcalization experimental plATform.这是一个... 阅读全文
posted @ 2015-04-13 11:28 max_xbw 阅读(601) 评论(0) 推荐(0)
摘要:摘要 对软件构建过程中所产生的错误(build process bugs)进行实证研究。 5个开源项目:CXF, Camel, Felix,Struts, and Tuscany。 把build process bugs 和 other bugs在3个维度比较:bug severity, bug fi... 阅读全文
posted @ 2015-04-10 16:12 max_xbw 阅读(378) 评论(0) 推荐(0)
摘要:摘要: 提出一种方法——ELBlocker,用于自动检测出Blocking Bugs(prevent other bugs from being fixed)。 难度在于这些Blocking Bugs仅占很小的比例( the class imbalance phenomenon)。 方法:给定一个训练... 阅读全文
posted @ 2015-04-05 14:53 max_xbw 阅读(611) 评论(0) 推荐(0)