Apache Storm 衍生项目之2 -- Trident-ML

欢迎转载,转载请注明出处,徽沪一郎,谢谢。

楔子

或许谈起storm是大数据实时计算框架已经让你不明觉厉,如果说storm还可以跟机器学习算法(ml)有机的结合在一起,是不是更加觉着高大尚呢。trident-ml就是一个这样让人无限遐想的产品。

其实要讲trident-ml无非是要回答这样几个问题,

  1. 什么是ml
  2. 什么是trident
  3. 为什么要将trident用于ml

trident-ml的官方站点  https://github.com/pmerienne/trident-ml

什么是ml

关于什么是ML(Machine Learning)以及machine learning的常见算法有哪些,详见维基百科中的介绍,要是觉着这解释不过瘾,那就来点有料的来自princeton大学的讲义

什么是trident

这个问题在本博的系列文章中已经屡次提及并有详尽的解释。

为什么要将trident和ml绑定在一块

Machine Learning机器学习库运行在trident之上使得分析的结果更为实时的反映出来,加快了调整步骤。举个例子吧,比如在逛京东或是amazon,通过这个实时的机器学习过程,后台服务可以给客户找到更为精确的推荐产品。

有什么同类的产品么

在软件这个世界里,从来不存在什么唯一,即然有trident-ml,那么就能找到同类的产品。

谈到机器学习,你可能听说过在该领域最牛的处理语言R。到了这里,想必已经料到与trident-ml相竞争的是一个什么东东了,对那就是trident-r。

trident-r的官方地址 https://github.com/quintona/storm-r

与trident-ml相比,trident-r表现的不够活跃,略显沉闷。

总结

关于apache storm,本博已经花了相当的篇幅来聊它的里里外外。从明儿开始,换个话题聊聊了。或者是yarn,或者是linux kernel或者是server application,谁知道呢?

posted @ 2014-02-14 20:54  徽沪一郎  阅读(1502)  评论(0编辑  收藏  举报