03 2013 档案

摘要:本文目的最近温习了一下C++ STL中的algorithm库函数,记得上次看这些内容时,还在读书,可以追溯到2009年春天了(刚好4年J)。正所谓为“温故而知新,可以为师矣”。闲话少说,开始正文。算法库C++标准算法库中包含一些模版函数,用于执行基本的算法,比如for_each(遍历容器),random_shuffle(随机打乱容器)等。主要实现包含在头文件<algorthim>中,少量在<numeric>中。它是STL的三大核心组件之一,其他两个是容器(container,常用数据结构)和迭代器(Iterator,数据结构访问适配器)。设计思想:算法函数通过迭代器作用 阅读全文
posted @ 2013-03-22 15:58 bourneli 阅读(9554) 评论(0) 推荐(0) 编辑
摘要:本文目的最近一段时间在Coursera上学习Data Analysis,里面有个assignment涉及到了决策树,所以参考了一些决策树方面的资料,现在将学习过程的笔记整理记录于此,作为备忘。算法原理决策树(Decision Tree)是一种简单但是广泛使用的分类器。通过训练数据构建决策树,可以高效的对未知的数据进行分类。决策数有两大优点:1)决策树模型可以读性好,具有描述性,有助于人工分析;2)效率高,决策树只需要一次构建,反复使用,每一次预测的最大计算次数不超过决策树的深度。如何预测先看看下面的数据表格:ID拥有房产(是/否)婚姻情况(单身,已婚,离婚)年收入(单位:千元)无法偿还债务(是 阅读全文
posted @ 2013-03-15 15:44 bourneli 阅读(201038) 评论(3) 推荐(17) 编辑
摘要:本文目的最近在Coursera上学习Data Analysis,结合前一阵子阅读的《Head First Statistics》,发现好多计算方法都涉及了假设检验(Hypothesis Test,又称“显著性检验”,Significance Test),用于检验模型的显著性。如回归分析,检测估计量的系数;卡方检验(运用卡方分布)检验模型的优度拟合和变量独立性。所以,决定梳理一下相关知识,作为备忘。原理&方法个人理解,假设检验就是利用反证法和小概率事件对原假设(Null Hypothesis)和备选假设(Alternative Hypothesis)进行选择。首先,假设原假设成立,那么就 阅读全文
posted @ 2013-03-12 14:49 bourneli 阅读(7517) 评论(0) 推荐(0) 编辑
摘要:最近在Coursera上学习Data Analysis课程,课程论坛中有个帖子针对交叉检验(Cross Validation)中训练数据集(train dataset),验证数据集(Validate dataset)和测试数据集(test dataset)展开讨论,内容挺好的,记录到这里,作为备忘。交叉检验(Cross Validation)在数据分析中,有些算法需要利用现有的数据构建模型,比如贝叶斯分类器,决策树,线性回归等,这类算法统称为监督学习(Supervisied Learning)算法。构建模型需要的数据称之为训练数据(Train Data)。模型构建完后,需要利用数据验证模型的正 阅读全文
posted @ 2013-03-11 15:10 bourneli 阅读(21666) 评论(0) 推荐(0) 编辑