gbase

导航

GBase8a数据库哈希索引的充分利用

使用索引通常会带来维护的成本,会影响数据加载及 DML 操作的性能,实际使用

时需根据具体需求而定。
Hash Index 通常可以用来解决等值查询的定位效率,特别是对以单表精确查询为
主的应用场景尤为适合,如电信业务中的并发话单查询等(特别是内存基本充足的场景)。
在使用上,GBase 8a MPP Cluster 一定是首先进行智能索引过滤的,之后,如果
发现查询条件中的等值查询条件列上建立了 Hash Index,则使用 Hash Index,否
则进行全 DC 扫描。这一点,可以在 Trace Log 中观察到对有实时数据加载的场景,
可以先建立无索引的临时表加载数据,再将临时表内数据插入到带索引的同结构
目标表中或在临时表上创建索引。一次性处理索引建立,可较大幅度地降低索引
带来的维护成本。

注意
1) 索引是一种有损的优化手段,使用索引通常会带来维护的成本,会影响数
据加载及 DML 操作的性能,实际使用时需根据具体需求而定;
2)选择建立 hash 索引的列应尽量选择重复值较少的列,否则 hash 冲突严重,
影响 hash 索引的性能;
3)二进制类型的列不适合使用 HASH 索引。

posted on 2024-09-24 11:03  GBase数据库  阅读(40)  评论(0)    收藏  举报