#命名规范:
local==> l
remote==> r
extract==> x
data pump==> p
source Trail==>st
Remote Trail==>rt
--------------------------
#《《源数据库orcl》》
Extract:将重做日志信息抽取存放到本地exttrail文件中
0.开启附加日志功能,开启强制日志模式;强烈建议源端每个涉及复制的表上建立主键或者唯一键
SQL> alter database force logging;
SQL> alter database add supplemental log data; #数据库最小级别开启
SQL> create tablespace ggs datafile size 200M autoextend on;
SQL> create user ggs identified by ggs;
SQL> grant dba to ggs;
GGSCI> add trandata schema.<tablename> #表别级别开启,给需要复制的表添加
GGSCI> info trandata schema.<tablename> #查看附加信息
相关附加日志参数:
注意: 每小时日志量评估
select trunc(completion_time),count(*)*100 size_in_MB from
v$archived_log group by trunc(Completion_time);
1.安装OGG
mkdir /goldengate
tar xf ogg.tar -C /goldengate #ogg.tar为软件名
chown -R oracle:oinstall /goldengate
cat>>/home/oracle/.bash_profile<<'EOF'
export GG_HOME=/goldengate
export LD_LIBRARY_PATH=$ORACLE_HOME/lib:$LD_LIBRARY_PATH
alias ggsci='ggsci $GG_HOME/ggsci'
EOF
2.创建子目录,编辑MGR
GGSCI>create subdirs
GGSCI>edit param mgr 添加下面端口
port 7809
AUTORESTART ER *, RETRIES 3, WAITMINUTES 5, RESETMINUTES 60
PURGEOLDEXTRACTS /goldengate/dirdat/*,USECHECKPOINTS,MINKEEPHOURS 24 #/goldengate/dirdat/*为抽取日志存放位置
3.定义本地抽取参数文件
GGSCI(Hostname) 1>edit param lxjack
extract lxjack
------------------------------------------------
-- local extract for schema
-- Author: vmsysjack
-- Created Date: 2020-02-10
------------------------------------------------
SETENV (NLS_LANG=AMERICAN_AMERICA.ZHS16GBK) #和源系统一致select * from v$nls_parameters where parameters like '%NLS_CHARACTERSET%';
USERID ggs@orcl,password ggs #定义连接抽取源的用户名和密码以及tns,orcl为源库的TNS名
ExtTrail dirdat/st #定义抽取重做日志信息存储地点;将会在$GG_HOME/dirdat/下生成st开头文件
Table schema.tablename; #定义需要抽取的“模式.表名”
注意:当密码使用加密方式的时候,需要使用使用encryptkey default
例如: 1. 生成密文
encrypt password ggs encryptkey default
2.将第一步生成的密文应用
userid ggs,password AAAAAAAAAAAAAAAAACCCCCSGSADGSDGWOXCJKLSJL,encryptkey default
4. 创建extract进程
GGSCI(HOSTname) 1> add extract lxjack,threads 2,tranlog,begin now #RAC源需要配置 ,threads 2表示有2个节点,单节点不用加threads 2
GGSCI(Hostname) 2> add exttrail dirdat/st,extract lxjack,megabytes 100 #添加抽取源文件位置和大小
注意:当在操作系统删除了exttrail文件后,启动会报 PROCESS ABENDING,使用下面方法解决
(1). GGSCI>delete exttrail dirdat/st* #我这里是测试环境,只有一个文件
(2). GGSCI>add exttrail dirdat/st,extract lxjack
5. 启动extract进程,验证extract进程
GGSCI(Hostname) 3> start extract lxjack
GGSCI(Hostname) 4> info extract lxjack # l=>local; x=>extract;
GGSCI(Hostname) 5> info extract lxjack,showch
GGSCI(Hostname) 5> info extract lxjack,detail
6. 验证抽取数据
GGSCI(Hostname) 5> stats extract lxjack #再重新开启一个终端,执行DML语句,使用stats extract lxjack查看
注意: 级联更新带来的问题
级联更新的触发器等对象存在,对于目标数据库系统上应该关闭或者禁用掉目标
数据库上的触发器和级别约束;使用如下语句:
SQL> alter table ... disable contraint ...
SQL> alter trigger ... disable ...
或者使用下面语句:需要数据库版本是10.2.0.5或11.2.0.2之后版本
DBOPTIONS suppresstriggers
配置DataPump:
本质上是一个Extract Group,需要参数文件,参数文件名字和这个extract group的组名一样。
参数中需要配置SourceTrail文件在哪里,以及发送的目标系统在哪里
1.定义参数文件
GGSCI(Hostname) 1>edit param lpjack # l=>local; p=>pump
extract lpjack
-------------------------------------------
-- Data Pump extract for schema.tablename
-- Author: vmsysjack
-- Created Date: 2020-02-10
--------------------------------------------
Uerid ggs@orcl,password ggs
PassThru #透传模式,源表和目标数据库表完全一样,源表与目标表不一致的时候需要用NoPassThru
RmtHost 目标主机ip地址,Mgrtort 目标主机mgr进程端口 #定义连接远端主机和端口
RmtTrail dirdat/rt #定义Remote Trail文件的文件名前缀,r=>remote;表示传递到远端的位置
Table schema.tablename; #传递的表名
2. 创建Data Pump进程
GGSCI(Host) 1> add extract lpjack,exttrailsource dirdat/st #定义DataPump进程名,以及需要抽取的源trail文件位置dirdat/st
GGSCI(Host) 2> add rmttrail dirdat/rt,extract lpjack,megabytes 100 #定义增加远程trail文件位置和远程trail文件大小
3. 启动Data Pump进程,验证Data Pump进程,统计抽取进程数据
GGSCI(Host) 3> start extract lpjack
GGSCI(Host) 4> info extract lpjack
GGSCI(Host) 5> stats extract lpjack
##《《目标数据库vmsys》》
0.创建目标数据库需要的表空间和用户
SQL> create tablespace ggt datafile size 200M autoextend on;
SQL> create user ggt identified by ggt;
SQL> grant dba to ggt;
1.创建全局参数文件,登录目标数据库,创建检查点表
注意:检查点表作为事务处理的一部分,可以有更好的恢复能力,有共用和专用两种做法
共用: 所有的replicate共用一个
专用: 每个replicate独立创建一个
GGSCI(Hostname) 1> edit param ./GLOBALS #需要执行GGSCI,在GG_HOME目录下
GGschema ggt #指定存储架构,此行也可以不写
checkpointtable ggt.chkpt #存储在ggt用户模式下
GGSCI(Hostname) 2> dblogin userid ggt@vmsys,password ggt #vmsys为目标数据库网络服务名
2. 从数据库层面检查检查点文件
SQL> show user; --当前还未增加检查点文件
USER is "ggt"
SQL> select table_name from user_tables; --ggt模式下没有表
no rows selected
GGSCI(Hostname) 3> add checkpointtable --增加检查点表文件
GGSCI(Hostname) 4> info checkpointtable
SQL> conn ggt/ggt #ggt为目标数据库创建的用户,即目标数据库登录GGSCI使用的用户
SQL> desc chkpt
SQL> desc chkpt_lox
SQL> show user;
USER is "ggt"
SQL> select table_name from user_tables;
TABLE_NAME
------------------------------
CHKPT_LOX
CHKPT
SQL> desc chkpt_lox;
Name Null? Type
----------------------------------------- -------- ----------------------------
GROUP_NAME NOT NULL VARCHAR2(8)
GROUP_KEY NOT NULL NUMBER(19)
LOG_CMPLT_CSN NOT NULL VARCHAR2(129)
LOG_CMPLT_XIDS_SEQ NOT NULL NUMBER(5)
LOG_CMPLT_XIDS NOT NULL VARCHAR2(2000)
SQL> desc chkpt;
Name Null? Type
----------------------------------------- -------- ----------------------------
GROUP_NAME NOT NULL VARCHAR2(8)
GROUP_KEY NOT NULL NUMBER(19)
SEQNO NUMBER(10)
RBA NOT NULL NUMBER(19)
AUDIT_TS VARCHAR2(29)
CREATE_TS NOT NULL DATE
LAST_UPDATE_TS NOT NULL DATE
CURRENT_DIR NOT NULL VARCHAR2(255)
LOG_CSN VARCHAR2(129)
LOG_XID VARCHAR2(129)
LOG_CMPLT_CSN VARCHAR2(129)
LOG_CMPLT_XIDS VARCHAR2(2000)
VERSION NUMBER(3)
SQL>
注意: replicate级别增加checkpointTable方式:
GGSCI> add replicat rejack,exttrail /goldengate/dirdat/vmsys/rt,checkpointTable ggt,rejackcht
--专有级别创建检查点文件,每个replicat都需要创建一个,各个replicate各自使用; 通过发现这种方式不会自动生成检查表,还是需要手工建立
create table rejack as select * chkpt where 0=1;
create table rejack_lox as select * chkpt where 0=1;
开始数据加载.....
.....
..... 当源表之前有数据的时候,需要通过exp,imp(impdump,expdump)存放到目标中
.....
配置Replicat进程
1. 定义replicat参数文件
GGSCI(Hostname) 1> edit param rejack #e=>replicat
replicat rejack
--------------------------------------------
-- replicat for jack.a
-- author: vmsysjack
-- Created Date: 2020-02-10
--------------------------------------------
SETENV (NLS_LANG=AMERICAN_AMERICA.ZHS16GBK)
USERID ggt@vmsys,password ggt #vmsys为目标表的TNS
HandleCollisions #处理冲突的数据,只能在数据初始化期间使用,后续不能使用这个处理冲突
AssumeTargetDefs #源数据表与目标数据库同步的表定义相同时候用此参数,不可以与sourcedefs参数文件同用
Map jack.*,Target jack.*;
2. 创建replicat进程
GGSCI(Hostname) 1> add replicat rejack,exttrail dirdat/rt
3. 启动replicat进程
GGSCI(Hostname) 2> start replicat rejack
4. 查看并验证replicat
GGSCI(Hostname) 3> info replicat rejack
GGSCI(Hostname) 4> stats replicat rejack
===================================================================
一. 表过滤
1. extract端:
Table schema.tablename
2. replicat端:
Map srcSchema.tablename,Target dstSchema.tablename
二. 列过滤: 只用抓取或者只复制指定的列,不是所有的列
1. extract端:
Table schema.tablename COLS(cola,colb.....);
注意: 列过滤不可以使用passthru
2. 使用colsExcept 抓取除了列出来的列之外的所有列
Table schema.tablename colsExcept(colx);
三. 行过滤: 只复制满足条件的行,分为两种类型(Complex和Non-Complex)
1. Non-Complex类型:非复杂类型;只能根据行过滤,支持@present,@absent,@null
1). extract端
Table schema.tablename,where (id<100);
2). replicat端
Map schema.tablename,Target schema.tablename,where (id<100);
2. Complex类型:复杂类型,支持各种GG函数,还可以安装操作类型过滤(filter实现)
for example:
2.1) 发生在id<100记录上的delete操作语句
Map schema.tablename,Target schema.tablename,filter (on delete,id<100);
2.2) 只捕获id<100的记录
Map schema.tablename,Target schema.tablename,filter (id<100);
2.3) 只捕获更新,删除操作,以及id<100的记录
Table schema.tablename,filter (on delete,on update,id>100);
2.4)列Name中有zhang字样的
Table schema.tablename,Filter (@StrFind(name,'zhang')>0)
2.5)函数计算的结果大于120000
Table schema.tablename,Filter (@compute((salary-tax)*12)>120000)
四. 数据映射,既可以在源端进行,也可以在目标端进行
#extract端配置样例1:
extract lxjack
SETENV (ORACLE_SID=orcl)
USERID ggs,PASSWORD ggs
ExtTrail ./dirdat/sx
TranLogOptions ExcludeUser(username)
Table sometable;
#extract端配置样例2:
extract lxjack
SETENV (ORACLE_SID=orcl)
USERID ggs,PASSWORD ggs
ExtTrail ./dirdat/sx
TranLogOptions ExcludeUser(username)
Table src.serviceChange,Target tgt.serviceChareg_DIM, #源表与目标表做映射
colMap(UseDefaults,ID=ServiceChareg_id,modified_at=Timeap); #usedefaults没有明确指出的列在两边都是相同的;需要映射的列需要在usedefaults后面表示出来。
#replicat端配置样例3:
replicat lrlog5
SETENV (NLS_LANG=AMERICAN_AMERICA.ZHS16GBK)
SETENV (ORACLE_SID=vmsys)
UserId ggt,password ggt
HandleCollisions
SourceDefs dirdef/smsg_logs.defs #此文件需要定义文件
Map jack.smsg_logs,Target jack.smsg_logs,
ColMap(UseDefaults,owner="zhangsan") #在列映射中给这个列加上一个初始值;每当源表中插入新记录,这个新记录复制到目标数据表后,owner字段会被自动赋值为zhangsan
#replicat端映射配置样例:
1). 当源表与目标表结构一致,在replicat参数文件中使用AssumeTargetDefs参数,代表两端结构一致。
2). 当源表与目标表结构不一致,需要映射,映射语句:
Map schema.tablename,Target schema.tablename,Colmap (UseDefaults,cola=cola);
--------------------------------------------------------------------------------------------------
需要哪一个数据库的数据定义文件,取决于映射操作是在哪里进行的,如果在目标端(replicat)完成映射,需要在源数据库定义文件,然后将生成的文件复制到目标数据库上,最后在replicat参数文件中引用它;
如果在源端(extract)完成映射,就反过来。
1.创建数据定义文件:
GGSCI(Hostname) 1> edit params defgen
DefsFile ./dirdef/rejackt2.defs #用未来要引用这个定义文件的replicat组名字来命名
UserId ggs,Password ggs
Table schema.tablename;
2.将定义文件使用工具生成定义文件:
./defgen paramfile dirtrm/defgen.prm
3.将第二步生成的defgen.prm复制到另外一台机器的$GG_HOME/dirdef文件夹中
4.修改参数
4.1)注释文本-->>AssumeTargetDefs
增加文本-->>SourceDefs dirdef/rejackt2.defs
-----------------------------
colmap(Usedefaults,owner="liulingfeng",ab=) 目标表有一列为空应该将这列写最后
colmap(Usedefaults,ab=,owner="liulingfeng") 目标表一列为空这种写法是错误的
AssumeTargetDefs 当能够通过colmap实现和源结构一致的情况下可以使用此参数,前提要表的结构一致
定义文件用于当源表和目标表不一致的情况下.可以使用.
--------------------------------------------------------------------------
1. 设置Trail文件的删除策略:
将下面的参数写入到Manager进程的参数文件中
PurgeOldExtracts /ggs/dirdat/sa*,
UseCheckpoints, --使用检查点
MinKeepHours 1; --即使检查点确认了删除后,还保留一个小时
FrequencyMinutes 30; --清理动作的频率为30分钟一次
2. 数据压缩
GG提供了数据压缩功能,对于低带宽的网络是有意义的,当设置了压缩,目标端Collector进程会自动的进行解压缩操作,然后写入Remote Trail文件中;数据的最大压缩比例可以达到5:1,默认数据不压缩。
例如:
Extract lpjack
PassThru
RmtHost dstIP,Mgrtort 7809,Compress,CompressThreshold 2048
#compressThreshold 2048 为压缩的最小数据块单位大小
RmtTrail dirdat/rs
Table schema.tablename;
--------------------------------------------------------------------------
1. 执行存储过程
Map source_table,Target target_table,
SQLEXEC (SPNAME spanme,PARAME (in_paraml=cola)),
#SPNAME指定存储过程名字,PARAMS参数定义的是IN参数和列的映射关系
COLMAP (Usedefaults,coln=@GETVAL(spname,out_paramn));
select name,value from v$diag_info; #获取跟踪诊断的相关信息
select * from v$pwfile_users; #获取授予sysdba权限的用户