01 2016 档案

日常数据分析的主要内容仍是结构化计算
摘要:日常业务中会出现各种各样的数据分析问题,但究其本质,其主要内容仍然是结构化数据的计算。比如: 指定时间段,计算各营业网点的月销售额比上期和同期比。 实现思路:对销售数据按时间段过滤,再按照营业网点、年、月进行三级分组汇总,最后进行跨行组的有序计算。 找出收盘价连续增长超过10天的股票。 实现思路:将 阅读全文

posted @ 2016-01-29 10:02 hivehooker 阅读(325) 评论(0) 推荐(0)

集算器协助java处理多样性数据源之HDFS
摘要:Java通过Hadoop提供的API访问HDFS不算困难,但针对其上文件的计算就比较麻烦。比如分组、过滤、排序等计算,用java来实现都比较复杂。集算器esproc能很好地协助java解决计算问题,同时也封装了HDFS的访问,借助esproc可以让java加强HDFS上文件的计算能力,结构化半结构... 阅读全文

posted @ 2016-01-19 09:32 hivehooker 阅读(264) 评论(0) 推荐(0)

集算器协助Java处理多样性数据源之Hive
摘要:Java使用jdbc连接Hive比较简单,但是Hive的计算能力相对于其它数据库的SQL而言较弱,要完成非常规的计算需要将数据取出后用Java进一步计算,编程比较麻烦。使用集算器配合Java编程,可以减少Java使用Hive时要进行复杂计算工作量。下面我们通过例子来看一下具体作法:Hive中的or... 阅读全文

posted @ 2016-01-15 08:20 hivehooker 阅读(383) 评论(0) 推荐(0)

集算器协助java处理多样性数据源之JSON
摘要:Java的json开源包一般只能解析json数据,没有运算功能。程序员自己写通用的程序来实现分组、排序、过滤、连接这些计算,相当麻烦。例如:用java写json文件条件过滤程序时,当条件表达式发生变化时就需要改写代码。如果要实现象SQL那样灵活的条件过滤,则需要自己实现动态表达式解析和求值,编程工... 阅读全文

posted @ 2016-01-12 08:54 hivehooker 阅读(746) 评论(0) 推荐(0)

导航