3.db2性能和优化
“db2中有分区、表空间、日志空间等的概念,所以在操作db2数据库时候,注意以上的设置,会大大提升sql的运行速度,也方便管理人员的管理和维护。了解其原理后,你会发现db2是典型的分布式集群”
1.db2的存储结构
假设仓库主机现在有40个节点,节点号为0-39升序排列,40个节点,即有40个分区,每个分区大小一致,且每个分区都有自己的表空间和日志空间。
2.指定表空间
表空间是存储表里数据记录的地方。
3.指定分区键 partitioning key
分区键的作用:在向表里面insert或者load数据时,是通过哈希算法根据分区键来计算出节点号,然后把分割的数据送往此节点,然后装入数据。
分区键的指定:指定分区键时一般要指定那些此列数据内容有很大差异的那些列,比如手机号码,id_no等,这样计算出的节点号分布比较均匀,数据才能均匀分布存放在40个节点。
不指定分区键:如果建表的时候没有指定分区键的话,系统默认使用表的第一个字段,分区键未指定或者分区键指定不恰当,会导致情况。
4.增加一个列
Alter table tab_tmp add column ph varchar(11)
说明:列增加后将不能删除。DB2中列加上后数据类型也不能改变,唯一能改变的是增加varchar类型的长度,只能增大。
5.修改表名
Rename bug.temp_tab to temp_tab2;
说明:temp_tab2不存在,方可执行成功。并且temp_tab2不加前缀,修改成功后表名为:bug.temp_tab2。
6.创建视图
create view as select id_no,phone_no from com.com_result_tab where ...
说明:视图唯一能修改的是引用类型列,改变列的范围。其他定义好了都不能修改。当视图基于的基表drop后,视图变为无效。创建视图,可以修改字段名称,对原表信息是一种保护。
7.表的左连接 left join。以及左表的选择。
选择1: 数据量小的表作为左表(业务逻辑允许的情况下)。
选择2:将使用条件筛选的表作为左表。
选择3:具有索引选择操作的表作为左表,否则每扫描左表中的一行,就要扫描一遍整个表。
选择4:重复记录少的表更趋向于作左表。
选择5:外关联时,on后面仅仅存放关联条件(也就是说必须是左右表的字段比较),对于关联表内部的条件应当放在where子句中,除非你想保留所有没有匹配上的记录。
8.尽量不使用in(select id_no from tabs...)
9.表连接是一定注意两个字段类型是否相同
比如A表,id_no 类型为bigint; B表,id_no 类型为varchar(); 此时以id_no作为连接条件,速度特别慢。
原因1:当连接两个不同类型的列时,其中一个列必须转换成另一个列的类型,级别低的会被转换成高级别的类型,转换操作会消耗一定的系统资源;
原因2:如果你使用两个不同类型的列来连接表,其中一个列原本可以使用索引,但经过转换后,优化器就不会使用它的索引了。
10.在查询中尽量不要使用or
使用union合并两个不同的查询结果集,这样查询性能会更好。
如果不是必须要不同的结果集,使用union all效果会更好,因为它不会对结果集排序,去重。88
11.更新表统计信息
Runstats的作用是重新更新数据库系统对表的统计信息,这些信息在数据库生成执行计划时将被使用。
12.整理表存储碎片
如果一个表的数据量变化很多,与操作系统的文件系统一样就会产生存储碎片,需要重新收集数据碎片和分布数据,从而提高数据访问效率。
reorg table tab_name
另外可以通过reorgchk on table…来检查碎片是否需要整理
13.在大数据量插入操作
可以采用不写日志方式,
一般情况下插入数据时必须避免插入笛卡尔集
注意:但如果执行被中断,表将损坏,无法使用。
14.为避免锁冲突,可以采用脏读模式
前提对数据一致性要求不高
---------------------------------------------------------------------------------------------完美分割线----------------------------------------------具体操作。
1.当前库连接其他库
db2 connect to db_name user db_id using db_pwd
说明:密码得问相关的管理人员,我们无法查看。name和id通过键入conn就可以显示。
2.创建视图
3.学会建立临时表
假设有三张或者三张以上的表进行连接,而且每张表的数据量都不小,此时就建立一张临时表,将其中的两张表关联的结果插入临时表(tab_temp1),之后再与其他表进行关联。
说明:数据量小的时候,看不出临时表的作用,但是数据量很到的时候,临时表可以避免让你等的很焦灼。
3.大量数据的插入操作
大量数据插入临时表中,采用不写日志的方式,避免日志满了。被force后,事务日志回滚,造成i/o繁忙。
4.对数据表进行过更新操作后记得commit
eg:insert into ;merge into;delete;update
显示提交事务,释放事务日志。
5.长时间不使用数据库记得断开数据库连接。
6.自己建立的临时表使用完之后记得删除
第一步:清空表数据
第二步:删除表
7.查询数据进行限定,一定不要select * from
8.初次碰见自己不知道的表,不要进行update 或者delete 操作,可以自己建立临时表玩。