11 2011 档案

摘要:学校图书馆有各大学术数据库的链接: http://210.32.137.90/newportal/libtb/index.jsp 比较常用的数据库简单描述如下 EI(engineering village):收录很全,包含绝大多数出版论文,但是收录的论文质量参差不齐,初学者难以辨别。属于二级数据库(不直接出版,索引其他出版社的出版物,因此不能直接下载论文) IEEE: 只收录IEEE自己的论文,它上面论文大致分三种: 一种是介绍性的,学术性不强,发表在《IEEE Computer》这种杂志性质的出版物上, 很多是大牛级人物对某方向高屋建瓴的阐述,初学者可以先找几篇这方面的论文看看;另一种是发表 阅读全文
posted @ 2011-11-10 16:24 浙大软院论文交流 阅读(341) 评论(0) 推荐(0)
摘要:《适用于云计算的面向查询数据库数据分布策略》文明波、丁治明 计算机科学(Computer Science) 第37卷,第9期 Vol-37 No.9 Sep 2010摘要:文章介绍了几种云环境下的数据分布策略以及各自的特点,包括水平分布,垂直分布,混合分布。由于当今主流的关系型数据库在设计之初就要求小的冗余度,表的属性集较小,导致垂直分布代价较高,因此目前实际应用的多是水平分布,主要有以下几种:轮转划分,范围划分,散列划分,由于这三种划分都存在一些不足,作者提出了一种新的数据分布策略,即面向查询的数据分布策略(SOD)。1、 分析影响数据查询效率的因素,提出解决方案:T=TTUS+EST+MA 阅读全文
posted @ 2011-11-08 22:17 浙大软院论文交流 阅读(783) 评论(2) 推荐(0)
摘要:《云计算下SPRINT并行算法研究》张春艳《软件》201第31卷 第11期论文的主要内容是:在云计算的Hadoop集群框架和数据挖掘技术中的 SPRINT 分类算法的基础上。详细描述SPRINT并行算法在 Hadoop中的MapReduce编程模型上的执行流程。并利用分折出的决策树模型 对输入数据进行分类。名词:map-reduce,map就是将一个任务分解成为多个任务。reduce就是将分解后多任务处理的结果汇总起来。得出最后的分析结果。主要的数学公式:1、分裂指数是属性分裂规则优劣程度的一个度量,Gini指数方法能够有效地搜索最佳分裂点。提供最小Gini指数的分割具有最大信息增益。被选为最 阅读全文
posted @ 2011-11-05 16:15 浙大软院论文交流 阅读(397) 评论(0) 推荐(0)