GaussDB-cm_agent参数

GaussDB-cm_agent参数

log_dir

参数说明:log_dir为存放cm_agent日志文件的目录。 必须是绝对路径。通过cm_ctl设置绝对路径时需要将路径用''把路径包含起来,例如:cm_ctl set --param --agent -k "log_dir='/log/dir'"。

取值范围:字符串,最大长度为1024。修改后需要重启cm_agent才能生效。参数修改请参见 set cm参数 进行设置。

默认值:'$GAUSSLOG/cm/cm_agent',表示在$GAUSSLOG下对应的cm目录下生成cm_agent日志。

log_file_size

参数说明:控制日志文件的大小。当'cm_agent-xx-current.log'日志文件达到指定大小时,则重新创建一个日志文件记录日志信息。

取值范围:字符串,[0MB, 2047MB],实际生效范围[1MB, 2047MB],单位:MB。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:16MB

log_min_messages

参数说明:控制写到cm_agent日志文件中的消息级别。每个级别都包含排在它后面的所有级别中的信息。级别越低,服务器运行日志中记录的消息就越少。

取值范围:枚举类型,有效值有debug5、debug1、warning、error、log、fatal(不区分大小写)。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:warning

incremental_build

参数说明:控制重建备DN模式是否为增量。打开这个开关,则增量重建备DN;否则,全量重建备DN。

取值范围:布尔型。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

  • on、yes、true、1:表示增量重建备DN。

  • off、no、false、0:表示全量重建备DN。

默认值:on

security_mode

参数说明:控制是否以安全模式启动DN。打开这个开关,则以安全模式启动DN;否则,以非安全模式启动DN。

取值范围:布尔型。修改后可以reload生效。参数修改请参见 set cm参数 进行设置。

  • on、yes、true、1:表示以安全模式启动DN。

  • off、no、false、0:表示以非安全模式启动DN。

默认值:off

upgrade_from

参数说明:就地升级过程中使用,用于标示升级前数据库的内部版本号,此参数禁止手动修改。

取值范围:非负整型,[0, 4294967295]。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:0

alarm_component

参数说明:在使用第一种告警方式时,设置用于处理告警内容的告警组件的位置。通过cm_ctl设置绝对路径时需要将路径用''把路径包含起来,例如:cm_ctl set --param --agent -k "alarm_component='/alarm/dir'"。

取值范围:字符串,最大长度为1024。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:/opt/huawei/snas/bin/snas_cm_cmd

alarm_report_interval

参数说明:指定告警上报的时间间隔。

取值范围:非负整型,[0, 2147483647],单位:秒。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:1

agent_heartbeat_timeout

参数说明:cm_server心跳超时时间。

取值范围:整型,[2, 2147483647],单位:秒。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:5

agent_connect_timeout

参数说明:cm_agent连接cm_server超时时间。

取值范围:整型,[0, 2147483647],单位:秒。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:1

agent_connect_retries

参数说明:cm_agent连接cm_server尝试次数。

取值范围:整型,[0, 2147483647]。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:15

agent_kill_instance_timeout

参数说明:当cm_agent在无法连接cm_server主节点后,发起一次终止本节点上所有实例的操作之前,所需等待的时间间隔。

取值范围:整型,[0, 2147483647]。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:0,不发起终止本节点上所有实例的操作。

agent_report_interval

参数说明:cm_agent上报实例状态的时间间隔。

取值范围:整型,[0, 2147483647]。单位:秒。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:1

alarm_report_max_count

参数说明:指定告警上报的最大次数。

取值范围:非负整型,[1, 2592000]。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:1

agent_check_interval

参数说明:cm_agent查询实例状态的时间间隔。

取值范围:整型,[0, 2147483647],单位:秒。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:2

enable_log_compress

参数说明:控制压缩日志功能。

取值范围:布尔型。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

  • on、yes、true、1:表示允许压缩日志。
  • off、no、false、0:表示不允许压缩日志。

默认值:on

process_cpu_affinity

参数说明:控制是否以绑核优化模式启动主DN进程。配置该参数为0,则不进行绑核优化;否则,进行绑核优化,且物理CPU片数为2n个。仅支持ARM。

取值范围:整型,[0, 2]。修改后需要重启数据库cm_agent才能生效,参数修改请参见 set cm参数 进行设置。

默认值:0

enable_xc_maintenance_mode

参数说明:在数据库为只读模式下,控制是否可以修改pgxc_node系统表。

取值范围:布尔型。修改后需要重启cm_agent才能生效。参数修改请参见 set cm参数 进行设置。

  • on、yes、true、1:表示开启可以修改pgxc_node系统表功能。

  • off、no、false、0:表示关闭可以修改pgxc_node系统表功能。

默认值:on

log_threshold_check_interval

参数说明:日志压缩和清除的时间间隔,每log_threshold_check_interval秒压缩和清理一次。

生效范围:请参见CM支持日志管理

取值范围:整型,[0, 2147483647],单位:秒。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:1800

log_max_size

参数说明:控制日志最大存储值,当日志总大小超过(log_max_size*95/100)MB时,根据压缩日志生成时间,依次删除历史压缩日志,直到日志总大小小于(log_max_size*95/100)MB。

生效范围:请参见CM支持日志管理

取值范围:整型,[0, 2147483647],单位:MB。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:10240

log_max_count

参数说明:可存储的最多日志数量,当日志总个数超过该值,根据压缩日志文件名时间,删除超过保留天数log_saved_days的压缩日志。

生效范围:请参见CM支持日志管理

取值范围:整型,[0, 10000],单位:个。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:10000

log_saved_days

参数说明:压缩日志保存的天数,压缩日志超过该值并且日志总个数超过log_max_count,删除压缩日志。

生效范围:请参见CM支持日志管理

取值范围:整型,[0, 1000],单位:天。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:90

NOTICE:

日志压缩能力受内存限制,最多只能检测到30000个日志文件。总日志量超过30000个文件时,无法保证日志能被正常压缩及删除。可以通过调整log_saved_days和log_threshold_check_interval快速清理已压缩日志文件。

agent_phony_dead_check_interval

参数说明:cm_agent检测进程是否僵死的时间间隔。

取值范围:整型,[0, 2147483647],单位:秒。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:10

unix_socket_directory

参数说明unix套接字的目录位置。通过cm_ctl设置绝对路径时需要将路径用''把路径包含起来,例如:cm_ctl set --param --agent -k "unix_socket_directory='/unix/dir'"。

取值范围:字符串,最大长度为1024。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:''

dilatation_shard_count_for_disk_capacity_alarm

参数说明:扩容场景下,设置新增的扩容分片数,用于上报磁盘容量告警时的阈值计算。

取值范围:整型,[0, 2147483647],单位:个。该参数设置为0,表示关闭磁盘扩容告警上报;该参数设置为大于0,表示开启磁盘扩容告警上报,且告警上报的阈值根据此参数设置的分片数量进行计算。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:1

enable_dcf

参数说明:DCF模式开关。

取值范围:布尔型。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。请根据数据库实例实际的DCF运行模式进行更改,否则会导致数据库实例不可用。

  • on、yes、true、1:表示启用dcf。
  • off、no、false、0:表示不启用dcf。

默认值:off

disaster_recovery_type

参数说明:主备数据库灾备关系的类型。

取值范围:整型,[0, 2]。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

  • 0表示未搭建灾备关系。
  • 1表示搭建了obs灾备关系。
  • 2表示搭建了流式灾备关系

默认值:0

agent_backup_open

参数说明:灾备模式设置,开启后CM按照灾备模式运行。

取值范围:整型,[0, 2]。修改后需要重启cm_agent才能生效。参数修改请参见 set cm参数 进行设置。

  • 0表示未搭建灾备关系。
  • 1表示搭建了obs灾备关系(之后不再支持)。
  • 2表示搭建了流式灾备关系。

默认值:0

environment_threshold

参数说明:环境资源监控阈值。

取值范围:string型。包含五个参数,分别为内存使用率阈值,cpu使用率阈值,磁盘IO阈值,实例的内存使用率阈值,实例的线程池使用率阈值,后两个参数只在分布式生效,前三个参数不区分集中式和分布式,超过阈值则会打印日志。修改后可以reload生效,参数修改请参见 set cm参数 进行设置。

默认值:(0,0,0,0,0)

max_connections_threshold

参数说明:使用DN管理端口和业务端口连接主DN失败后检测DN当前已使用的连接数,如果超过最大配置连接数的阈值,不做僵死处理,否则按照僵死流程处理。

取值范围:整型,[0, 100]。修改后可以reload生效。参数修改请参见 set cm参数 进行设置。

  • 0表示关闭使用业务端口连接DN判定僵死流程,不打印DN堆栈,不判断DN已使用的连接数,只使用管理端口连接DN判断是否僵死。

默认值:90

thread_effective_time

参数说明:线程运行一轮的有效超时时间。超时说明此线程卡住,进程自动退出。

取值范围:整型,[0, 1200],单位:秒。修改后可以reload生效,参数修改请参见set cm参数进行设置。

  • 0表示关闭线程监控能力。

注意:不建议调整参数值大小,如果调整请联系华为技术支持。

默认值:60

ping_fault_kill_inst_timeout

参数说明:主DN实例与所有备机ping不通后,重启该实例的超时时间。

取值范围:整型,[0, 1000],单位:秒。修改后可以reload生效。参数修改请参见set cm参数进行设置。

备注说明:cm_server也会读取该参数,修改参数后,通知cm_server请参见reload 参数进行设置。

  • 0表示关闭ping fault处理能力。

默认值:30

high_cpu_threshold

参数说明:CPU高使用率的阈值,当CPU超过阈值,cm_agent会根据检测周期将CPU使用信息打印到日志中,默认:1s/次。

取值范围:整型,[0, 100],单位:%。修改后可以reload生效。参数修改请参见set cm参数进行设置。

默认值:95

high_mem_threshold

参数说明:内存高使用率的阈值,当内存超过阈值,cm_agent会根据检测周期将内存使用信息打印到日志中,默认:1s/次。

取值范围:整型,[0, 100],单位:%。修改后可以reload生效。参数修改请参见set cm参数进行设置。

默认值:95

high_disk_threshold

参数说明:磁盘高IO的阈值,当IO超过阈值,cm_agent会根据检测周期将IO信息打印到日志中,默认:1s/次。并连续打印10次,频率为1s/次,将iostat -xm信息输出到system_stat日志中。

取值范围:整型,[0, 100],单位:%。修改后可以reload生效。参数修改请参见set cm参数进行设置。

默认值:95

sys_check_interval

参数说明:系统资源检测周期,即CPU,内存,磁盘IO检测的间隔时间。配置成0则关闭检测。

取值范围:整型,[0, 10],单位:秒。修改后可以reload生效。参数修改请参见set cm参数进行设置。

默认值:1

asyn_log_enable

参数说明:异步日志开关,打开后cm_agent启动异步日志。

取值范围:布尔型。修改后可以reload生效。参数修改请参见set cm参数进行设置。

  • on、yes、true、1:表示cm_agent开启异步日志。
  • off、no、false、0:表示cm_agent不开启异步日志,使用串行日志。

默认值:on

asyn_log_max_buf_size

参数说明:异步日志缓存大小,当异步日志发生堆积,且积压的日志超过了缓存大小,后续的日志无法记录。

取值范围:字符串,[1KB, 1048576KB],单位:KB。修改后可以reload生效。参数修改请参见set cm参数进行设置。

默认值:1024KB

asyn_log_fault_solution

参数说明:识别到日志磁盘故障后,异步日志处理方案。当CM识别到日志盘故障或异步日志缓存溢出,CM会根据配置来处理异步日志。

取值范围:整型,[0, 2]。修改后可以reload生效。参数修改请参见set cm参数进行设置。

  • 0:表示不对日志做多余的处理,缓存区保留所有日志,直到缓存大小达到上限,达到上限后不会记录更多日志。
  • 1:表示对日志进行筛选,识别到日志磁盘故障后,只将关键日志、告警和ERROR级别以上的日志保存到缓存区,直到缓存大小达到上限,达到上限后不会记录更多日志。
  • 2:表示丢弃日志,识别到日志磁盘故障后,只将关键日志、告警保存到缓存区,直到缓存大小达到上限,达到上限后不会记录更多日志。

默认值:0

disk_check_hung_timeout

参数说明:磁盘I/O hang的超时时间,磁盘检测的单次I/O,如果超过这个时间,则认为磁盘已经I/O hang。。配置成0则关闭磁盘hang检测。

取值范围:整型,[0, 1000],单位:秒。修改后可以reload生效。参数修改请参见set cm参数进行设置。

默认值:默认值是20,但如果安装时无法判断被检测磁盘是否为条带化,则会将默认值改为60。

disk_check_block_timeout

参数说明:磁盘因文件系统某些原因,导致unlink这类文件操作阻塞。这类操作如果阻塞超过此参数设定的时间,才会判定磁盘故障。配置为0,表示关闭此判断。

取值范围:整型,[0, 1000],单位:秒。修改后可以reload生效。参数修改请参见set cm参数进行设置。

默认值:60

disk_check_interval

参数说明:控制磁盘I/O hang检测的流量,即最少需要在多长时间内写入指定的数据。默认检测周期是5秒,配置成0则关闭磁盘检测。

取值范围:整型,[0, 1000],单位:秒。修改后可以reload生效。参数修改请参见set cm参数进行设置。

默认值:5

disk_check_io_size

参数说明:控制磁盘检测的流量,即在检测周期内向磁盘中写入的数据大小,这个是直接对磁盘的I/O操作。默认是写入512B的数据,如果检测的磁盘为条带化,则安装的时候会把默认参数改为262144B(256KB)。最大写入1G的数据。配置成0则关闭磁盘I/O hang检测。磁盘检测白名单包括:CM数据目录、DN数据目录、日志目录所在磁盘以及自定义表空间目录所在磁盘。

取值范围:整型,[0, 1073741824],单位:B。修改后可以reload生效。参数修改请参见set cm参数进行设置。

默认值:512

enable_e2e_rto

参数说明:端到端RTO开关,开启后僵死检测周期及网络检测超时时间将缩短,CM可以达到端到端RTO指标(单实例故障RTO<=10s,叠加故障RTO<=30s)。

取值范围:整型,[0, 1]。1表示开启,0表示关闭。修改后可以reload生效,参数修改请参考set cm参数进行设置。

默认值:0

process_unhealthy_alarm_time

参数说明:进程状态检测超时告警参数,当进程长时间处于某种异常状态(D/T/Z)时,超过此参数时间则触发进程异常告警。

取值范围:整型,[0, 2147483647],单位:秒。0表示关闭此功能。修改后可以reload生效。参数修改请参见set cm参数进行设置。

默认值:60

enable_tblspc_disk_check

参数说明:是否开启表空间磁盘检测开关。

取值范围:布尔型。修改后需重启集群生效,参数修改请参见set cm参数进行设置。

  • on、yes、true、1:表示开启表空间磁盘检测,即表空间所在磁盘hang,中止对应DN。
  • off、no、false、0:表示不开启表空间磁盘检测。

默认值:on

max_network_package_loss

参数说明:检测DN主备之间丢包率,DN主丢包率超过阈值,触发重启操作

取值范围:整型,[0, 99],单位:%。0表示关闭此功能。修改后可以reload生效。参数修改请参见set cm参数进行设置。

默认值:30

enable_auto_start

参数说明:控制cm_agent是否自动拉起DN。

取值范围:整型,[0, 1]。1表示开启自动拉起DN,0表示关闭自动拉起DN。参数修改请参见set cm参数进行设置。

默认值:1

enable_check_az_network

参数说明:是否开启az级数据面网络检测。

取值范围:布尔型。修改后可以reload生效,参数修改请参见设置CM参数动态加载CM参数进行设置。

  • on、yes、true、1:表示开启az级数据面网络检测。
  • off、no、false、0:表示关闭az级数据面网络检测。

默认值:on

expect_stop_az_name

参数说明:az级网络检测功能,期望停止的az名字。

取值范围:string型。取值为空时,与cmserver主相反的az上的实例停止。修改后可以reload生效,参数修改请参见设置CM参数动态加载CM参数进行设置。

默认值:空

check_az_network_concurrency

参数说明:az级网络检测支持并发数。

取值范围:整型,[1,10]。修改后可以reload生效,参数修改请参见设置CM参数动态加载CM参数进行设置。

默认值:2

 
posted @ 2024-10-29 15:48  jerrywang1983  阅读(49)  评论(0)    收藏  举报