3.db2性能和优化

db2中有分区、表空间、日志空间等的概念,所以在操作db2数据库时候,注意以上的设置,会大大提升sql的运行速度,也方便管理人员的管理和维护。了解其原理后,你会发现db2是典型的分布式集群

1.db2的存储结构

假设仓库主机现在有40个节点,节点号为0-39升序排列,40个节点,即有40个分区,每个分区大小一致,且每个分区都有自己的表空间和日志空间。

2.指定表空间

表空间是存储表里数据记录的地方。

3.指定分区键  partitioning key

分区键的作用:在向表里面insert或者load数据时,是通过哈希算法根据分区键来计算出节点号,然后把分割的数据送往此节点,然后装入数据。

分区键的指定:指定分区键时一般要指定那些此列数据内容有很大差异的那些列,比如手机号码,id_no等,这样计算出的节点号分布比较均匀,数据才能均匀分布存放在40个节点。

不指定分区键:如果建表的时候没有指定分区键的话,系统默认使用表的第一个字段,分区键未指定或者分区键指定不恰当,会导致情况。

4.增加一个列

Alter table tab_tmp add column ph varchar(11)

说明:列增加后将不能删除。DB2中列加上后数据类型也不能改变,唯一能改变的是增加varchar类型的长度,只能增大。

5.修改表名

Rename  bug.temp_tab  to temp_tab2;

说明:temp_tab2不存在,方可执行成功。并且temp_tab2不加前缀,修改成功后表名为:bug.temp_tab2。

6.创建视图

create view  as select id_no,phone_no from com.com_result_tab where ...

说明:视图唯一能修改的是引用类型列,改变列的范围。其他定义好了都不能修改。当视图基于的基表drop后,视图变为无效。创建视图,可以修改字段名称,对原表信息是一种保护。

7.表的左连接 left join。以及左表的选择。

选择1: 数据量小的表作为左表(业务逻辑允许的情况下)。

选择2:将使用条件筛选的表作为左表。

选择3:具有索引选择操作的表作为左表,否则每扫描左表中的一行,就要扫描一遍整个表。

选择4:重复记录少的表更趋向于作左表。

选择5:外关联时,on后面仅仅存放关联条件(也就是说必须是左右表的字段比较),对于关联表内部的条件应当放在where子句中,除非你想保留所有没有匹配上的记录。

8.尽量不使用in(select id_no from tabs...)

9.表连接是一定注意两个字段类型是否相同

比如A表,id_no 类型为bigint; B表,id_no 类型为varchar();  此时以id_no作为连接条件,速度特别慢。

 

原因1:当连接两个不同类型的列时,其中一个列必须转换成另一个列的类型,级别低的会被转换成高级别的类型,转换操作会消耗一定的系统资源;

原因2:如果你使用两个不同类型的列来连接表,其中一个列原本可以使用索引,但经过转换后,优化器就不会使用它的索引了。

10.在查询中尽量不要使用or

使用union合并两个不同的查询结果集,这样查询性能会更好。

如果不是必须要不同的结果集,使用union all效果会更好,因为它不会对结果集排序,去重。88

11.更新表统计信息

Runstats的作用是重新更新数据库系统对表的统计信息,这些信息在数据库生成执行计划时将被使用。

12.整理表存储碎片

如果一个表的数据量变化很多,与操作系统的文件系统一样就会产生存储碎片,需要重新收集数据碎片和分布数据,从而提高数据访问效率。

reorg table tab_name

另外可以通过reorgchk on table…来检查碎片是否需要整理

13.在大数据量插入操作

可以采用不写日志方式,

一般情况下插入数据时必须避免插入笛卡尔集

注意:但如果执行被中断,表将损坏,无法使用。

14.为避免锁冲突,可以采用脏读模式

前提对数据一致性要求不高

---------------------------------------------------------------------------------------------完美分割线----------------------------------------------具体操作。

1.当前库连接其他库

 db2 connect to db_name user db_id using db_pwd

 说明:密码得问相关的管理人员,我们无法查看。name和id通过键入conn就可以显示。

2.创建视图

3.学会建立临时表

       假设有三张或者三张以上的表进行连接,而且每张表的数据量都不小,此时就建立一张临时表,将其中的两张表关联的结果插入临时表(tab_temp1),之后再与其他表进行关联。

       说明:数据量小的时候,看不出临时表的作用,但是数据量很到的时候,临时表可以避免让你等的很焦灼。

3.大量数据的插入操作

大量数据插入临时表中,采用不写日志的方式,避免日志满了。被force后,事务日志回滚,造成i/o繁忙。

4.对数据表进行过更新操作后记得commit

eg:insert into ;merge into;delete;update

显示提交事务,释放事务日志。

5.长时间不使用数据库记得断开数据库连接。

6.自己建立的临时表使用完之后记得删除

第一步:清空表数据

第二步:删除表

7.查询数据进行限定,一定不要select * from 

8.初次碰见自己不知道的表,不要进行update 或者delete 操作,可以自己建立临时表玩。

posted @ 2018-03-23 16:23  top4  阅读(1950)  评论(0编辑  收藏  举报