随笔分类 - 数据挖掘/机器学习
大数据高级算法,如:遗传算法(GA),神经网络(BP),模拟退火(SA)
数学建模。
摘要:
阅读全文
摘要:Php 5.3.29版本 windows7环境 1、首先要下载 php_pdo_sqlsrv_53_ts_vc9.dll php_sqlsrv_53_ts_vc9.dll 下载地址:http://share.weiyun.com/dc589fc41567ce6e3fb8b131ec1553ff 这两
阅读全文
摘要:• 数据挖掘的挖掘方法包括:( ) 算法工程师 京东 • 为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务? 算法工程师 京东 • CRISP DM(即“跨行业数据挖掘标准流程”)将项目分成的阶段为( ) 京东 运营 • 关联规则分析的Apriori算法在机器学习和数据挖掘中广
阅读全文
摘要:机器学习——降维(主成分分析PCA、线性判别分析LDA、奇异值分解SVD、局部线性嵌入LLE) 以下资料并非本人原创,因为觉得石头写的好,所以才转发备忘 (主成分分析(PCA)原理总结)[https://mp.weixin.qq.com/s/XuXK4inb9Yi 4ELCe_i0EA] 来源: 石
阅读全文
摘要:统计量 统计量 通过从总体中抽取样本构造适当的统计量,由样本性质推断总体性质的样本函数。 常用的统计量 1)样本均值 2)样本方差、标准差 3)样本的变异系数——C=根号(D(x))/E(x) 4)k阶距 5)中心距 6)样本偏度 7)样本峰度 注:偏度、峰度在质量控制和可靠性研究应用较多。 次序统
阅读全文
摘要:数据的概率及其分布 前面几章都是从简单的数据整理与统计的角度去分析数据,而数据的概率分布有助于我们进一步地推测数据的分布特点。数据挖掘需要不断地实践,因此在学习的过程中可以借助Excel、spss等工具去辅助,用Excel计算二项分布概率值得操作见 统计学(第六版)贾俊平。 变量——>离散型、连续型
阅读全文
摘要:数据的概括性度量 数据的分布特征可从三方面去描述:1)分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度; 2)分布的离散程度,反映各数据远离其中心值的趋势; 3)分布的形状,反映数据分布的偏态和峰态。 集中趋势的度量 分类数据:众数 一组数据中出现次数最多的变量值,主要用于测度分类数据的集中趋势
阅读全文
摘要:数据预处理1、数据审核:检查数据中是否有错误 原始数据->完整性:所调查的对象是否有遗漏。 准确性:数据是否有错误、存在异常值 ->异常值 :记录错误,予以纠正;正确地值,予以保留。 二手数据->适用性:明确数据的来源、口径、背景材料,以便确定数据是否符合分析研究的需要。 时效性:对于时效性较强的问
阅读全文
摘要:前言 描述数据的统计学学意义是大数据分析的挖掘的基础,它包括数据的收集、整理、显示,对数据中的有用信息的提取和分析,有利于我们更好地利用数据探索数据背后蕴藏的关系,下面是一些用来分析的统计量: 集中趋势的特征值: 算术平均数、调和平均数、几何平均数、众数、中位数等,其中均数适用于满足正态分布和对称分
阅读全文
摘要:【这是笔者上一篇博客,本文提供另一种方式去解决调用matlab工具箱的问题】http://www.cnblogs.com/Erma/p/9349185.html 啥也不说了,上主要代码! 一些需要注意的地方:
阅读全文
摘要:【作者吐槽】辗转反侧解决C#调用matlab调用神经网络工具箱的问题,一致报错,内容详情如下: 首先申明,调用matlab自带的函数都没有问题,比如一些计算平均数、普通的画图函数等试过了没有问题,但是调用工具箱的神经网络函数就一直报错,没找到原因。后来官方解释是这样的: 【笔者提供一些非神经网络工具
阅读全文
摘要:【插件式开发相关资料】https://www.cnblogs.com/lenic/p/4129096.html 以BP算法为例: 1、首先定义一个接口规范 2、BP算法实现接口 注:以上的BP算法为BP算法的函数逼近,下一步是需要将BP的学习训练网络与预测过程分离,即实时进行学习训练,按任务的指定进
阅读全文
摘要:fitness函数如下:
阅读全文