代码改变世界

随笔档案-2013年5月17日

关于HIVE的SELECT count(*) 优化

2013-05-17 16:00 by java20130722, 1606 阅读, 收藏,
摘要: 刚刚下载了一份HIVE的最新源码。印象最深的是HIVE将表的大小作为了元数据保存在了关系数据库中。譬如在老版本中执行如下的语句:from base insert overwrite table user select * ;你会发现日志的末尾会有 “999 ROWD LOADED INTO TABLE USER” 的字样代表有999条目记录保存在了user表中。在而在新版本中,执行最后的日志展示了USER表的元数据,其中会有ROW_COUNT:999的字样一看MYSQL中,999这个数据确实被保存了起来。也就是说大家以后不必再用“select count(*) from user ”去查询us 阅读全文