随笔分类 -  数据挖掘/机器学习

大数据高级算法,如:遗传算法(GA),神经网络(BP),模拟退火(SA) 数学建模。
摘要:![](https://img2018.cnblogs.com/blog/733795/201907/733795-20190719091431861-840420209.png) 阅读全文
posted @ 2019-07-19 09:15 程序媛墨禾 阅读(475) 评论(0) 推荐(0)
摘要:Php 5.3.29版本 windows7环境 1、首先要下载 php_pdo_sqlsrv_53_ts_vc9.dll php_sqlsrv_53_ts_vc9.dll 下载地址:http://share.weiyun.com/dc589fc41567ce6e3fb8b131ec1553ff 这两 阅读全文
posted @ 2019-06-23 15:02 程序媛墨禾 阅读(925) 评论(0) 推荐(0)
摘要:• 数据挖掘的挖掘方法包括:( ) 算法工程师 京东 • 为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务? 算法工程师 京东 • CRISP DM(即“跨行业数据挖掘标准流程”)将项目分成的阶段为( ) 京东 运营 • 关联规则分析的Apriori算法在机器学习和数据挖掘中广 阅读全文
posted @ 2019-06-06 20:41 程序媛墨禾 阅读(838) 评论(0) 推荐(0)
摘要:机器学习——降维(主成分分析PCA、线性判别分析LDA、奇异值分解SVD、局部线性嵌入LLE) 以下资料并非本人原创,因为觉得石头写的好,所以才转发备忘 (主成分分析(PCA)原理总结)[https://mp.weixin.qq.com/s/XuXK4inb9Yi 4ELCe_i0EA] 来源: 石 阅读全文
posted @ 2019-04-13 09:37 程序媛墨禾 阅读(735) 评论(0) 推荐(0)
摘要:统计量 统计量 通过从总体中抽取样本构造适当的统计量,由样本性质推断总体性质的样本函数。 常用的统计量 1)样本均值 2)样本方差、标准差 3)样本的变异系数——C=根号(D(x))/E(x) 4)k阶距 5)中心距 6)样本偏度 7)样本峰度 注:偏度、峰度在质量控制和可靠性研究应用较多。 次序统 阅读全文
posted @ 2018-10-05 08:40 程序媛墨禾 阅读(732) 评论(0) 推荐(0)
摘要:数据的概率及其分布 前面几章都是从简单的数据整理与统计的角度去分析数据,而数据的概率分布有助于我们进一步地推测数据的分布特点。数据挖掘需要不断地实践,因此在学习的过程中可以借助Excel、spss等工具去辅助,用Excel计算二项分布概率值得操作见 统计学(第六版)贾俊平。 变量——>离散型、连续型 阅读全文
posted @ 2018-10-04 09:25 程序媛墨禾 阅读(959) 评论(0) 推荐(0)
摘要:数据的概括性度量 数据的分布特征可从三方面去描述:1)分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度; 2)分布的离散程度,反映各数据远离其中心值的趋势; 3)分布的形状,反映数据分布的偏态和峰态。 集中趋势的度量 分类数据:众数 一组数据中出现次数最多的变量值,主要用于测度分类数据的集中趋势 阅读全文
posted @ 2018-10-03 10:17 程序媛墨禾 阅读(1636) 评论(0) 推荐(0)
摘要:数据预处理1、数据审核:检查数据中是否有错误 原始数据->完整性:所调查的对象是否有遗漏。 准确性:数据是否有错误、存在异常值 ->异常值 :记录错误,予以纠正;正确地值,予以保留。 二手数据->适用性:明确数据的来源、口径、背景材料,以便确定数据是否符合分析研究的需要。 时效性:对于时效性较强的问 阅读全文
posted @ 2018-10-02 10:28 程序媛墨禾 阅读(4319) 评论(0) 推荐(0)
摘要:前言 描述数据的统计学学意义是大数据分析的挖掘的基础,它包括数据的收集、整理、显示,对数据中的有用信息的提取和分析,有利于我们更好地利用数据探索数据背后蕴藏的关系,下面是一些用来分析的统计量: 集中趋势的特征值: 算术平均数、调和平均数、几何平均数、众数、中位数等,其中均数适用于满足正态分布和对称分 阅读全文
posted @ 2018-09-30 14:28 程序媛墨禾 阅读(1274) 评论(0) 推荐(0)
摘要:【这是笔者上一篇博客,本文提供另一种方式去解决调用matlab工具箱的问题】http://www.cnblogs.com/Erma/p/9349185.html 啥也不说了,上主要代码! 一些需要注意的地方: 阅读全文
posted @ 2018-08-05 17:54 程序媛墨禾 阅读(2394) 评论(1) 推荐(0)
摘要:【作者吐槽】辗转反侧解决C#调用matlab调用神经网络工具箱的问题,一致报错,内容详情如下: 首先申明,调用matlab自带的函数都没有问题,比如一些计算平均数、普通的画图函数等试过了没有问题,但是调用工具箱的神经网络函数就一直报错,没找到原因。后来官方解释是这样的: 【笔者提供一些非神经网络工具 阅读全文
posted @ 2018-07-22 09:51 程序媛墨禾 阅读(4355) 评论(0) 推荐(1)
摘要:【插件式开发相关资料】https://www.cnblogs.com/lenic/p/4129096.html 以BP算法为例: 1、首先定义一个接口规范 2、BP算法实现接口 注:以上的BP算法为BP算法的函数逼近,下一步是需要将BP的学习训练网络与预测过程分离,即实时进行学习训练,按任务的指定进 阅读全文
posted @ 2018-07-13 11:25 程序媛墨禾 阅读(399) 评论(0) 推荐(0)
摘要:fitness函数如下: 阅读全文
posted @ 2018-05-19 09:28 程序媛墨禾 阅读(2127) 评论(0) 推荐(0)