Storm入门准备
storm官网:http://storm-project.net/
1.
入门的最佳途径是阅读GitHub上的官方《Storm Tutorial》。其中讨论了多种Storm概念和抽象,提供了范例代码以便你可以运行一个Storm Topology。开发过程中,可以用本地模式来运行Storm,这样就能在本地开发,在进程中测试Topology。一切就绪后,以远程模式运行Storm,提交用于在集群中运行的Topology。Maven用户可以使用clojars.org提供的Storm依赖,地址是http://clojars.org/repo。
要运行Storm集群,你需要Apache Zookeeper、ØMQ、JZMQ、Java 6和Python 2.6.6。ZooKeeper用于管理集群中的不同组件,ØMQ是内部消息系统,JZMQ是ØMQ的Java Binding。有个名为storm-deploy的子项目,可以在AWS上一键部署Storm集群。关于详细的步骤,可以阅读Storm Wiki上的《Setting up a Storm cluster》。
2.
官网的教程见参考文献2,参考文献3为参考文献2的中文翻译版。
参考文献:
[1]:http://www.infoq.com/cn/news/2011/09/twitter-storm-real-time-hadoop
[2]:https://github.com/nathanmarz/storm/wiki/Tutorial
[3]:http://xumingming.sinaapp.com/138/twitter-storm%E5%85%A5%E9%97%A8/