随笔档案「2020年12月27日」：小记--------phoenix创建二级索引 ... - 二黑诶

2020年12月27日

摘要： //给单个字段创建二级索引 create index pushOrderTime_IDX on "new_push_order_tb"("pushOrderTime"); //给多个字段创建二级索引 CREATE INDEX ALL_INDEX ON "new_push_order_tb"("dri 阅读全文

posted @ 2020-12-27 01:09 二黑诶阅读(287) 评论(0) 推荐(0)

小记--------hive命令行sql小栗子(一)

摘要： 1.创建 orc 格式 hive表 CREATE TABLE IF NOT EXISTS order_user_all ( renter_id int COMMENT '用户id', order_q int COMMENT '近90天订单数',pay_normal_all double COMMEN 阅读全文

posted @ 2020-12-27 01:02 二黑诶阅读(290) 评论(0) 推荐(0)

小记--------hive修改字段类型

摘要：一、使用alter table change column 命令直接修改 alter table mini_program_tmp_month_on_month change column month_on_month_reading month_on_month_reading 二、如果表中已经有阅读全文

posted @ 2020-12-27 00:57 二黑诶阅读(9859) 评论(1) 推荐(0)

小记--------hive导出CSV格式

摘要： hive -e " set hive.cli.print.header=true; //获取列名 Select * from $line;" | sed 's/\t/,/g' > $line.csv //utf-8格式 \t为分隔符 iconv -f UTF-8 -c -t GBK ./$line. 阅读全文

posted @ 2020-12-27 00:55 二黑诶阅读(235) 评论(0) 推荐(0)

记一次---------集群升级CDH版本到6.3.2程序运行报错

摘要：测试程序：原来运行环境是升级后的运行环境执行在低版本环境的程序 1.首先将高版本的pom文件修改、 2.在将resource配置文件配置然后执行程序报错首先追踪错误代码行APP 45行。是sparkSQL读hive仓库的表最后一个报错代码说：无法识别的hadoop主版本号然后就在考阅读全文

posted @ 2020-12-27 00:50 二黑诶阅读(285) 评论(0) 推荐(0)

记一次--------linux集群连接远程mongo库无法写入数据问题

摘要：因为部门集群与公司mongo集群是不在同一集群上，但是在同一内网，所以应该是正常可以访问。 1.确保两个集群之间是可以互相访问的使用telnet命令可以正常通信 2.通过mongo shell 测试连接两种连接方式： mongo -u test -p test --host 127.0.0.1 阅读全文

posted @ 2020-12-27 00:46 二黑诶阅读(176) 评论(0) 推荐(0)

记一次--------yarn日志没有聚合，解决方法

摘要：抛错，说日志没有聚合，解决方法，是因为/tmp/logs/root/logs 这个路径不存在，所以在hdfs上创建路径应该就可以了。 [ root@iZbp15fg3f6yd73afpeya8Z logs]# cat yarn.log /tmp/logs/root/logs/applicati 阅读全文

posted @ 2020-12-27 00:45 二黑诶阅读(868) 评论(1) 推荐(0)

记一次--------spark 读 mysql 报错no suitable driver

摘要：报错日志如下：意思是：没有合适的驱动，按道理来说，如果找不到Java的driver驱动应该会报错为：class not found mysql.jdbc.driver 。但是不知道为啥报错这个。解决方法：在脚本中添加--driver-class-path 指定mysql-connection 阅读全文

posted @ 2020-12-27 00:43 二黑诶阅读(257) 评论(0) 推荐(0)

小记--------hive 4大排序案例

摘要： 1.order by order by和其他sql一样对查询结果集执行一个全局排序，也就是说会有一个所有的数据都通过一个reducer进行处理的过程会消耗大量时间来执行 Ex: select * from renter_info order by create_time desc ; 2.sort 阅读全文

posted @ 2020-12-27 00:40 二黑诶阅读(162) 评论(0) 推荐(0)

于二黑

公告