2016年11月8日

matlab的kmeans

摘要: matlab的k均值聚类分析,用kmeans命令,能输出类别、距离和、距离等数据。结合silhouette plot,能优化k参数选择。 [IDX,C,sumd,D] = kmeans(X,k) X是样本,k是类别数目,IDX是与下标对应的类别号,C是每个类别的中心,sumd是距离的和,D是每个点到 阅读全文

posted @ 2016-11-08 10:09 cwzhit 阅读(575) 评论(0) 推荐(0)

2016年11月6日

matlab的kNN

摘要: knnsearch Find k-nearest neighbors using dataexpand all in page Syntax IDX = knnsearch(X,Y) [IDX,D] = knnsearch(X,Y) [IDX,D] = knnsearch(X,Y,'Name',Va 阅读全文

posted @ 2016-11-06 17:21 cwzhit 阅读(501) 评论(0) 推荐(0)

kNN的matlab实现

摘要: 参考(http://blog.sina.com.cn/s/blog_8bdd25f80101d93o.html),最后几行修改为 %k近邻,取k=7,交叉验证法如何确定k的值???? %选取7个最小值,用最简单的比较法试 M=[]; for i=1:210 M=[M distance(x,y,xne 阅读全文

posted @ 2016-11-06 15:40 cwzhit 阅读(1744) 评论(0) 推荐(0)

2016年10月30日

一篇关于机器学习与金融预测的文章

摘要: 抽空阅读了《Stock Market Forecasting Using Machine Learning Algorithms》文章,有以下一些问题值得记录一下: (1)方法的原理是,利用不同地区市场、不同类别市场(如黄金、股票)的相关性以及已经发生的走势情况,预测NASDAQ走势。分析表明效果不 阅读全文

posted @ 2016-10-30 21:08 cwzhit 阅读(482) 评论(0) 推荐(0)

2016年10月22日

多特征数据预处理的一种尝试

摘要: 在一个实例中,有近60个特征,上千组数据样本。考虑到数据受噪声污染可能比较严重,希望能首先筛除部分不合理数据,也就是仅采用高度集中区域的数据。那么,问题就是,如何找到数据高度集中区域。找到数据密集区,数据之间的规律性更强,更利于接下来的识别。 首先考虑到的就是抽样,或者美其名曰蒙特卡洛抽样。这是一种 阅读全文

posted @ 2016-10-22 10:36 cwzhit 阅读(580) 评论(0) 推荐(0)

导航

< 2025年6月 >
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 1 2 3 4 5
6 7 8 9 10 11 12
点击右上角即可分享
微信分享提示