随笔分类 -  大数据

大数据相关博客
摘要:1,安装 hive的版本的选择,是选择内置的数据库保存元数据,还是用外部的mysql之类的数据库保存元数据,同时,如果使用外置的mysql,需要注意对mysql远程访问的配置。 再就是关于文件的配置了,环境变量个配置,可以在系统的/etc/profile目录下配置hive所在的目录,还可以在hive 阅读全文
posted @ 2017-05-10 17:45 北宫风晨 阅读(168) 评论(0) 推荐(0)
摘要:一,离线计算和实时计算各自的应用场景? 我观察似乎有些人认为实时计算比离线计算更加牛逼,然而是这个样子的么,只能说没有谁更加牛逼,只是各自的应用场景不同而已。 对于离线计算,想要得到某段时间的报表数据,这个时候可以使用离线计算,比如说进行大规模的矩阵运算,例如人脸识别的场景,这个时候就适合离线计算, 阅读全文
posted @ 2017-04-19 09:53 北宫风晨 阅读(352) 评论(0) 推荐(0)