摘要: 采用基于正域的约简。数据:Ticdata2000 记录数:5822 条件属性:85结果:1、 Core i7 3632QM 4四核八线程 2.2G 动态加速3.2G 0.516s2、 Core i3 2100 双核四线程 3.1G 0.813s3、 Pentium 4 530 超线程关闭 3G 5.625s4、 Core 2 Quad Q9400 四核四线程 2.66G 2.68s无论数据集大小,Sandy Bridge及以后的CPU都能全速运行。而对Q9400这类CPU来讲:1、 对中小数据量(10MB以下), 即便发起64个线程,CPU利用率也只能60%-70%; 线程数低的时候,CPU利 阅读全文
posted @ 2013-09-16 11:58 simcity 阅读(735) 评论(0) 推荐(0)
摘要: 在粗糙集约简过程中的一个重要步骤,划分等价类中,需要存储等价类。等价类的存储分配有两种策略:一次一分配和一步到位。一次一分配的步骤是出现先一个新等价类,调用一次malloc,以Forest Covertype为例,第一遍划分时会形成581012个等价类。这样需要调用581012次malloc,存储代价是 581012*sizeof(equivalence class) + 581012*sizeof(指针) 个字节。一步到位的方法是一次性申请581012个等价类的大存储区域。一次一分配会过多进行函数调用,581012或许不多,但数据增大到20亿条时就不是可以忽略的代价,而且破坏数据局部性。好处 阅读全文
posted @ 2013-09-16 11:56 simcity 阅读(367) 评论(0) 推荐(0)
摘要: 电脑症状:桌面复制的文件重启后消失;新安装的软件重启后也自动消失。排查:使用autoruns观察,发现安装了麦咖啡和360两套“安全”软件,除此外并无异常,任务管理器內也无异常发现。过程:1、保险起见卸载麦咖啡,重启发现故障依旧。2、发现右下角提示:启用临时配置文件。进行跟踪,发现果然使用的是临时配置文件,原配置文件达到1.88GB,可能超出配额限制,被强制停用。google “profile exceeds size limit”,一堆英语,懒的看了。想起《windows internals》里面有提这个问题,可我没看啊。3、暂时解决方法:新建用户账户,发现原来故障现象消失。重新启动后也正常 阅读全文
posted @ 2013-09-16 11:54 simcity 阅读(983) 评论(0) 推荐(0)
摘要: This is a bit of a workaround, but it's the only way I know of to export an Excel plot into a vector format such as EPS or EMF. In my case I needed to export the plot to EPS for inclusion within a LaTeX document. Create the plot in Excel Copy the plot and paste it into a new, empty word document 阅读全文
posted @ 2013-09-16 11:53 simcity 阅读(360) 评论(0) 推荐(0)
摘要: Go to Control Panel.Click on Ease of Access link or Ease of Access Center icon.Select Change how your mouse works or Make the mouse easier to use option.Tick the check box for Prevent Windows from being automatically arranged when moved to the edge of the screen with the mouse under “Make it easier 阅读全文
posted @ 2013-09-16 11:52 simcity 阅读(423) 评论(0) 推荐(0)
摘要: LATEX入门与提高.陈志杰数理学院喜闻乐见的电子书。这本电子书由于是图片版本,所以无法使用搜索功能,幸亏目录详细。LaTeX Beginner's Guide.latex使用者都是从模版开始学习,有很多基本问题都是零零碎碎解决。这种方式对于偶尔使用latex来说由于投入适中,具备良好性价比,这也是刘邦使用韩信的方式?对于需要长期使用者而言,这种做法就不适宜了。这种情况下必须具备基本的宏观视野,例如如何自行编写一个模版?这本书很好地解决了这个问题,甚至还指导读者安装tex编辑器。这本书有文字本PDF,可以搜索内容。Guide to LaTeX,4ed和上一本类似,而且也有文字版PDF。 阅读全文
posted @ 2013-09-16 11:50 simcity 阅读(201) 评论(0) 推荐(0)
摘要: 一、说明。所谓决策表,类似于关系数据库的二位数据表,形如:43 01 0 181 01 2 01 2 173 174 0排序后输出:1 0 11 2 01 2 14 3 07 3 17 4 08 1 0二、问题由来。决策表约简是粗糙集的一个经典问题。关于如何解释粗糙集约简问题,我有一个很简单的解释,不过不会在这里写出。简而言之约简就是在保持原有数据集分类能力的前提下删除冗余属性。粗糙集的创始者Pawlak有着一个近乎偏执的理念:知识就是分类。完成分类是进一步完成粗糙集约简的基础。所以针对如何分类就有了各种各样的解法。蛮力算法就是两两比较,完成分类,这个复杂度很高。在这种情况下,先排序再分类是一 阅读全文
posted @ 2013-09-14 18:18 simcity 阅读(379) 评论(0) 推荐(0)
摘要: 一、一万小时的苦练“这项研究的结果表明,一个人的技能要达到世界水平,他的练习时间就必须超过10 000个小时——任何行业都不例外,”神经学专家丹尼尔·利瓦廷(Daniel Levitin)写道,“无论是作曲家、篮球运动员、作家、滑冰运动员、钢琴演奏家、棋手,还是作案屡屡得手的惯犯,对他们的练习时间进行统计的结果,一次次毫不例外地都得到10 000这同一个数字。10 000个小时相当于每天练习3个小时,或者一周练习20个小时,或者是10年的练习时间。当然,这并不能解释为什么有些人的练习时间远远超过其他人。然而,不需要花费多少时间练习,一个人的技能就达到世界水准,目前还没有这样的案例。可 阅读全文
posted @ 2013-06-21 18:57 simcity 阅读(363) 评论(0) 推荐(0)
摘要: 2013.06.15-2013.06.17一不小心摔了下,呆在寝室,索性读读书吧。下午粗略翻下量化研究方法,我手上的是鸡公社第五版影印,距离第一版出版的1990年已有21年。个人认为这本书的第三版、第五版最好:第一版年代久远没看过;第二版我对比过目录其中内容都融入了第三版;第四版的不好的地方在于CD的引入,对于买纸版书的人来说CD是不可容忍的,个人就不喜欢这一版;第五版改正了CD这个问题的同时,内容大幅更新。第一章和前几版一样,一个概述。第三版作者饶有兴味地谈论了芯片定价过程以及芯片公司研发比例问题。第二章直接转入存储器层次结构。存储器层次结构最初由冯.诺伊曼、Wilks以及Goldstine 阅读全文
posted @ 2013-06-18 22:03 simcity 阅读(284) 评论(0) 推荐(0)
摘要: 1、Win7下面:搜索栏输入search ===>点击 Indexing Options2、Win8下面先点下搜索框,激活搜索菜单高级选项--->改变索引位置点击修改按钮,索引位置上面要搜索的地方打勾 阅读全文
posted @ 2013-06-12 16:11 simcity 阅读(201) 评论(0) 推荐(0)