关注领域建模

追随UML,学会思考

随笔分类 -  沪深股市的数据挖掘

沪深股市的数据挖掘(5)---课题总结
摘要:今天是月底,所以要回顾本月的课题:数据挖掘。 数据挖掘是一门新兴学科,目前正大行其道。从微软的excel中的数据挖掘插件到具体公司要求的BI,都离不开这个课题。而我本月的主要目的是进行数据挖掘的一些回顾与练习,并以实际的沪深股市为例,从中获取一些经验。 无论是分类还是聚类,无论是差异点分析还是神经网络的,它们大致的过程都是一样的,而且这里涉及到的东西还有模式的识别问题(如图像、声音等)。可以说,数... 阅读全文

posted @ 2009-04-30 10:24 Beewolf 阅读(1148) 评论(1) 推荐(0)

沪深股市的数据挖掘(4)
摘要:本周公务繁忙,数据挖掘的工作就停止了。其实,结果早就出来了,但是让人觉得不可思议。 如下表: 6052 SH600715 SH600217 1 2008年 2065.34012930187 243 8.499342095892458982 SZ000058 SH600217 1 2008年 2032.25540745317 240 8.4677308643881... 阅读全文

posted @ 2009-04-17 10:56 Beewolf 阅读(349) 评论(0) 推荐(0)

沪深股市的数据挖掘(3)
摘要:进行了20只股票与所有沪深的股票的关联比对,耗时35分钟。 经过简单计算,发现需要耗时40多个小时才能够计算出提前1天的全部股票的关联关系,竟然如此耗时!!! 就20只股票来说,百分比最高的前10名都与一只股票有关联:600217。兴冲冲的打开google,搜索后发现竟然是只ST股票,关联度高达8.5,有点搞笑。就是说有10多只股票在前一天的走势能与600217相联系!! 还有两支股票的关系也很有... 阅读全文

posted @ 2009-04-09 16:09 Beewolf 阅读(383) 评论(0) 推荐(0)

沪深股市的数据挖掘(2)
摘要:设想终于变成了现实。 今天,经过一系列的计算,终于挖掘出了第一个关系:A股票前一天的涨跌幅与B股票的今日的涨跌幅的关系。 493 SH600001 SH600568 1 2008年 1346.772230952761050 SH600001 SZ000587 1 2008年 1342.02748967951177 SH600001 SZ000780 1 ... 阅读全文

posted @ 2009-04-09 14:20 Beewolf 阅读(395) 评论(0) 推荐(0)

沪深股市的数据挖掘(1)
摘要:根据任江涛老师的讲课要点:数据挖掘虽然不能预测明日的股市走向,但是却能够从大量的历史数据中找到这样的一种关系:一只股票前几日的走势会对另外的一只股票今日的走势产生影响。 我决定4月份对沪深股市进行一番数据挖掘,看看能不能找到这样的关联关系。以前也想挖掘,但是条件不够,不过现在都满足了:数据、设备、与技术支持。 4、1-4、2进行了数据准备。200万条数据加载到数据库中。 4、3进行BW的数据存储设... 阅读全文

posted @ 2009-04-03 16:46 Beewolf 阅读(540) 评论(0) 推荐(0)

导航