摘要:
WMSYS.WM_CONCAT: 依赖WMSYS 用户,不同oracle环境时可能用不了,返回类型为CLOB,可用substr截取长度后to_char转化为字符类型LISTAGG : 11g2才提供的函数,不支持distinct,拼接长度不能大于4000,函数返回为varchar2类型,最大长度为4000.with temp as( select 'China' nation ,'Guangzhou' city from dual union all select 'China' nation ,'Shanghai' city f 阅读全文
posted @ 2013-08-30 14:21
oycn0755
阅读(161)
评论(0)
推荐(0)
摘要:
1,SQL自身的优化:调优,并行处理2,stage的拆分与合并:实践测试为准 如多个JOIN的stage双方都为大数量(几百万一般大于200w)则考虑合并。如大表但JOIN的数据不大就不用合并。 如一个stage中的两个表都为大表且关联很慢时考虑拆分为两个stage作Join(select后数据不大:小于40w)3,选用合理的stage: 像sort,之类的尽量少用,在数据库里完成4,大数据量(上千万)上述方法都优化不明显后 可考虑采用直接INSERT 语句 使用Oracle后台处理,而非DS资源抽取插入。DataStage Job优化指导原则之一:算法的优化。 任何程序的优化,第一点首... 阅读全文
posted @ 2013-08-30 10:11
oycn0755
阅读(507)
评论(0)
推荐(0)
摘要:
Join: 数据集内连接,外连接(Left,Rigth)Lookup: 数据字典关联,左关联Transform : 数据计算,通过利用系统函数和表达式进行数据列计算转换,输入输出Mapping;数据分流,定义constraints数据分流、过滤。条件表达式:相当于自定义函数Aggregator 汇总Copy 一个数据集复制为多个数据集Filter 一个数据集不同过滤条件 多个输出数据集,一个Reject(条件都不满足时)Funnel 烟囱,多个输入一个输出 ,相当于Union allRemove Duplicates 去重:一个排序的输入一个非重复输出,依据关键字段判断重复数据Sort 排序: 阅读全文
posted @ 2013-08-30 10:03
oycn0755
阅读(450)
评论(0)
推荐(0)

浙公网安备 33010602011771号