Pyramid For Stock Market 诞生
一、开发理念
传统股票市场研究手段主要分为基本分析和技术分析。而随着技术条件的提升及高端数据发布格局的改变,一些通过对交易数据进行深度挖掘的分析手段也开始涌现。再加之中国国内实情,政策信息面分析、股票基本面分析、传统技术分析及数据挖掘分析可谓四足鼎立。这四种分析手段使得股票市场的参与者面临着海量的信息、各异的观点及复杂的决策。要在股票市场中生存,就必须学会在瞬息万变的资讯潮流中生存。单凭提高个人能力及操作水平已不足以应对这一切,我们需要一套程式化、智能化的解决方案。我们希望利用计算机技术自动地过滤无用的、不可信的信息,同时将最有用的数据、信息汇聚,甚至帮我们完成初步的分析,以供我们在更高层次上统领全局、做出决策。
Pyramid For Stock Market(下简称PFSM)就是在这么一个理念的指导下进行开发的。
二、系统简述
提供传统技术分析的各种股票行情软件已经相当成熟,为缩短开发周期,PFSM将作为对现有行情软件的补充进行开发,侧重对股票基本面分析、政策信息面分析及数据挖掘分析提供技术性支持。
数据挖掘:Level-2数据逐笔分析、资金流动分析、资金户口持仓分析、散户及主力意愿分析等;
信息、政策、基本面:通过NLP技术自动获取个股相关新闻及行业背景政策等,并且对新闻、消息进行自动处理,抓取核心内容为用户做出判定提供基本参考。(详见“特色简述”部分)
三、特色简述
a) 允许用户自定义新闻、消息来源
通过DOM节点分析、语义关联技术并以广告过滤算法为辅助(而非常见的正则表达式),系统能较好地抓取任意网页的正文内容。如此实现了对个股或大盘新闻、消息无广告、汇聚式的阅读,同时节省了大量从不同站点、页面之间搜索、人工过滤、跳转所耗费的时间。
b) 自动摘要
通过自动摘要技术,系统能筛选出新闻或消息主要内容。用户利用其自动摘要,基本上能了解新闻中包含的重要数据和事实,并且快速判断出其对市场可能产生的影响。(我希望能在下一个版本通过SVM技术实现通过新闻预测其影响,并据此对新闻进行归类同时对个股进行自动评级和评级分数统计)
开始忘记那些从字里行间费力搜寻有用信息的痛苦经历吧,也该让眼睛休息一下了。
c) 关键词提取及相关新闻搜索
d) 人物追踪
重要人物的一言一行往往都会在市场上产生不小的影响。通过中国姓名规律及词间组合统计数据等,系统能自动识别文中出现的人名,并为用户追踪其动向。(相关新闻搜索及历史事件追踪)
e) 媒体观点(试验)
为用户提供各媒体对个股、行业、大盘、人物、新闻事件等的看法,同时提供计数及排名机制
f) 原生的多维数据挖掘及分析模型
g) 优质的基础数据
四、关于测试邀请的说明
通过随机抽选,我已经通过电子邮件向部分来过这里的朋友发送了测试邀请函。如有兴趣参加测试的朋友可通过电子邮件或留言的方式与我取得联系,我会视具体情况发放测试邀请函。
作者:邓勖帆
文档日期:2009年2月24日
关键词:新闻 数据 挖掘 股票市场 NLP PFSM

