摘要:
随机森林之特征选择摘要:在随机森林介绍中提到了随机森林一个重要特征:能够计算单个特征变量的重要性。并且这一特征在很多方面能够得到应用,例如在银行贷款业务中能否正确的评估一个企业的信用度,关系到是否能够有效地回收贷款。但是信用评估模型的数据特征有很多,其中不乏有很多噪音,所以需要计算出每一个特征的重要性并对这些特征进行一个排序,进而可以从所有特征中选择出重要性靠前的特征。一:特征重要性在随机森林中某个特征X的重要性的计算方法如下:1:对于随机森林中的每一颗决策树,使用相应的OOB(袋外数据)数据来计算它的袋外数据误差,记为errOOB1.2: 随机地对袋外数据OOB所有样本的特征X加入噪声干扰( 阅读全文
posted @ 2013-11-28 22:35
HackerVirus
阅读(4592)
评论(0)
推荐(0)
摘要:
内存映射和堆栈内存映射文件内存映射文件可以用于3个不同的目的: 系统使用内存映射文件,以便加载和执行.exe和DLL文件。这可以大大节省页文件空间和应用程序启动运行所需的时间。 可以使用内存映射文件来访问磁盘上的数据文件。这使你可以不必对文件执行I/O操作,并且可以不必对文件内容进行缓存。 可以使用内存映射文件,使同一台计算机上运行的多个进程能够相互之间共享数据。Windows确实提供了其他一些方法,以便在进程之间进行数据通信,但是这些方法都是使用内存映射文件来实现的,这使得内存映射文件成为单个计算机上的多个进程互相进行通信的最有效的方法。内存映射数据文件的方法 1、一个文件,一个缓存... 阅读全文
posted @ 2013-11-28 22:31
HackerVirus
阅读(420)
评论(0)
推荐(0)
摘要:
Winform(C#.NET)自动更新组件的使用及部分功能实现声明:核心功能的实现是由园子里圣殿骑士大哥写的,本人是基于他核心代码,按照自己需求进行修改的。 而AutoUpdaterService.xml文件生成工具是基于评论#215楼 ptangbao的代码而改写的。由于这个组件是在10年写的,.net也有更新有的方法已提示过时,更改如下://Added the function to support proxy//clientDownload.Proxy = System.Net.WebProxy.GetDefaultProxy();clientDownload.Proxy = We... 阅读全文
posted @ 2013-11-28 22:27
HackerVirus
阅读(868)
评论(0)
推荐(1)
摘要:
编程面试的10大算法概念汇总嘿,第一次翻译文章,在ProgramCreek看到的,原文章名为Top 10 Algorithms for Coding Interview, 对于我这个明年即将直奔BAT(目前想法,以后不一定)但基础知识又差的小程序媛而言有点价值,就拿来翻译了下,并发表在伯乐在线。文章本身只是总结介绍简单概念,起个抛砖引玉的作用,具体深入了解需要自己慢慢学习,关键是文章中及末尾给出出了很多非常优秀的参考资料,可以继续深入掌握。下面是正文,有啥想吐槽的请直接评论在下面。正文:以下是在编程面试中排名前10的算法相关的概念,我会通过一些简单的例子来阐述这些概念。由于完全掌握这些概念需要 阅读全文
posted @ 2013-11-28 22:26
HackerVirus
阅读(304)
评论(0)
推荐(0)
摘要:
Jumony Core 3,真正的HTML引擎,正式版发布2013-11-28 17:22 by Ivony...,778阅读,18评论,收藏,编辑Jumony是一个开源项目,已经有三年的历史了,在这三年中,秉承提供给.NET程序员完整的HTML掌控能力,Jumony历经无数次的改进,终于进入了一个新的阶段。Jumony Core 3是一个真正意义上的HTML引擎。Jumony Core 3目前已经在NuGet上发布,请直接在NuGet包管理器中搜索 Jumony Core ,即可下载。项目地址:https://github.com/Ivony/Jumony一、解析器也许很多人会认为,目前的H 阅读全文
posted @ 2013-11-28 22:24
HackerVirus
阅读(826)
评论(0)
推荐(0)
摘要:
MongoDb企业应用实战(一) 写在MongoDB应用介绍之前故事背景: 本人有幸,经老友( 现为x知名快递公司技术总监 ) 推荐进入中国前三大民营快递公司之一工作,在此非常感谢他,在此也非常感谢我在第一家公司帮助我进步的兄弟(我在时的项目经理,现为 x 知名自动识别行业企业部门高级经理)。下面介绍6年后和6年前的两个单表大数据故事。(1) 6年后 单表大数据 之故事(一) 来之前老友告之现在核心运营系统 Oracle数据库中单表数据半年过10亿了,使用传统T-Sql不论如何优化,查询客户信息速度也提升不上去。需要使用企业级搜索引擎(Solr)来解决本部门其余两大辅助业务系统去查询客户信息。 阅读全文
posted @ 2013-11-28 22:23
HackerVirus
阅读(224)
评论(0)
推荐(0)
摘要:
HBase在单Column和多Column情况下批量Put的性能对比分析网址:http://www.cnblogs.com/panfeng412/archive/2013/11/28/hbase-batch-put-performance-analysis-of-single-column-and-multiple-columns.html针对HBase在单column family单column qualifier和单column family多column qualifier两种场景下,分别批量Put写入时的性能对比情况,下面是结合HBase的源码来简单分析解释这一现象。1. 测试结果在客 阅读全文
posted @ 2013-11-28 22:21
HackerVirus
阅读(260)
评论(0)
推荐(0)
摘要:
Hadoop集成长期以来,我每开个系列,只有兴趣写一篇,很难持之与恒。为了克服这个长久以来的性格弱点,以及梳理工作半年的积累。最近一个月会写两篇关于Mongo在地理大数据方面的实践和应用,一篇关于推荐系统的初期准备过程,一篇用户行为矩阵的可视化。希望能够立言为证,自我监督。1.驱动准备言归正传,前文MongoDB集群部署完毕之后,CRUD就是主要需求。NoSQL与普通关系数据库不同的是,避免采用ORM框架对数据库做操作,这样会带来明显的性能下降[1]。使用原生的Driver是一个较为合理的选择,Mongo支持的语言非常多,包括JS,Java,C,C++,Python,Scala等[2]。如果是 阅读全文
posted @ 2013-11-28 22:18
HackerVirus
阅读(315)
评论(0)
推荐(0)
摘要:
OpenCascade MatrixOpenCascade Matrixeryar@163.com摘要Abstract:本文对矩阵作简要介绍,并结合代码说明OpenCascade矩阵计算类的使用方法。关键字Key Words:OpenCascade、Matrix、C++一、引言Introduction矩阵的研究历史悠久,拉丁方阵和幻方在史前年代已有人研究。作为解决线性方程的工具,矩阵也有不短的历史。1693年,微积分的发现者之一莱布尼茨建立了行列式论(theory of determinants)。1750年,克拉默又定下了克拉默法则。1800年代,高斯和威廉若尔当建立了高斯-若尔当消去法。从 阅读全文
posted @ 2013-11-28 22:15
HackerVirus
阅读(377)
评论(0)
推荐(0)
摘要:
ECMAScript 6中的let和const关键词2013-11-28 21:46 by BarretLee,21阅读,0评论,收藏,编辑ECMAScript 6中多了两个定义变量的关键词,一个是let,另一个是const,后者顾名思义就是常量定义,前者的作用域范围是块级的。一般写过js的童鞋都知道,同其他语言一样,JS中的变量作用域是函数域而不是块级分割的,但是涉及到变量提升(hosting),闭包等问题的时候,很多有经验的程序员依然会头疼。var a = 5;if(true){ var a = 10;}console.log(a);//10上面的结果是10,但是我们看到,在if b... 阅读全文
posted @ 2013-11-28 22:11
HackerVirus
阅读(211)
评论(0)
推荐(0)
浙公网安备 33010602011771号