AmazingCounters.com

文章分类 -  量化R语言

摘要:聚类和分类判别有什么区别? 简单的说,聚类的分析没有学习集,而分类有学习集 1. 关键度量指标:距离(r中dist( )函数可用于算距离) 常用距离 绝对值距离 欧氏距离 闵可夫斯基距离 切比雪夫距离 马氏距离 Lance和Williams距离 离散变量的距离计算 2.动态聚类:K-means方法 阅读全文
posted @ 2017-08-27 16:43 大数据技术笔记 阅读(1695) 评论(0) 推荐(0)
摘要:常见分类模型与算法 线性判别法 距离判别法 贝叶斯分类器 决策树 支持向量机(SVM) 神经网络 1.线性判别法 原理:用一条直线来划分学习集(这条直线不一定存在吗?),然后根据待测点在直线的哪一边决定它的分类 R语言实现:library(MASS) ld=lda(G~x1+x2) ld 2.距离判 阅读全文
posted @ 2017-08-27 16:27 大数据技术笔记 阅读(27610) 评论(0) 推荐(0)
摘要:一 创建学号为2014101-2014200的学生信息 里面包括数学,英语,线性代数,物理四科成绩,以数据框的形式分析 找每科的最高值,最低值,每位同学的各科成绩和,求各个同学成绩的标准差 plot(chengji) plot(chengji[,2],chengji[,3]) 阅读全文
posted @ 2017-08-20 20:18 大数据技术笔记 阅读(145) 评论(0) 推荐(0)
摘要:1 创建变量和矩阵 2 基本数值处理函数 3 数组 4 数据框 5 文本文件和excel的读取 6 for,while语句的格式 7 R脚本注意 8 分布函数 一 创建向量和矩阵 函数c( ), length( ), mode( ), rbind( ), cbind( ) c()函数可以创建向量,s 阅读全文
posted @ 2017-08-20 18:10 大数据技术笔记 阅读(618) 评论(0) 推荐(0)

AmazingCounters.com