select a.owner, a.table_name, a.column_name, a.data_type, d.constraint_type, a.num_nulls from all_tab_columns a left join ( select b.owner, b.TABLE_NA Read More
查看某个某个字段的注释名等 select a.owner as 用户名 ,a.TABLE_NAME as 表名 ,b.COMMENTS as 表注释名 ,a.COLUMN_NAME as 字段名 ,a.comments as 字段注释 from dba_col_comments a join dba Read More
需求场景,组内排序,例如统计某个用户前10次消费金额,如求某个相同id或组内的top值 步骤一,创建测试表 create table tmp_partition_test ( name string, subject string, score int ) 步骤二,插入测试数据 insert int Read More
Group By 默认情况下,Map阶段同一Key数据分发给一个reduce,当一个key数据过大时就倾斜了。 但并不是所有的聚合操作都需要在Reduce端完成,很多聚合操作都可以先在Map端进行部分聚合,最后在Reduce端得出最终结果。 1)开启Map端聚合参数设置 (1)是否在Map端进行聚合 Read More
据两个例子, 第一个数层级关系的递归,用循环 begin for orgId in (select org_id from DWSDATA.T_AGENT_ORG_ID group by agent_id ) loop insert into ken.all_agent(agent_id,all_c Read More
进入到,50070页面报错,There are 1557 missing blocks. The following files may be corrupted: 步骤1,检查文件缺失情况 执行一下代码, hdfs fsck / -list-corruptfileblocks,查看哪些数据块损坏 Read More
问题:在使用hive的insert into 往表里插入数据时 ,却发现原来的数据被覆盖了。如下图,如论insert 语句执行多少次,只会有最新的一条数据。(情况跟overwrite一样) 经过多次查找原因,才知道时因为飘号的原因,去掉飘号就可以了 总结: 所以要么用户名和表名分别都加飘号,要么就都 Read More