【linux之clickhouse的问题记录】记由于clickhouse服务内存打满导致cpu/mem都飙升然后网卡ip消失
在记录相关文档的过程中发现监控中关于该节点的clickhouse数据异常,随后在node节点监控中也不见该节点信息
于是找到相关机器进行检查,堡垒机发现无法连接clickhouse的节点,随后找同网段的机器尝试ping一下测试连通性,
随后发现无法ping通
错误信息:
From 172.21.0.1 icmp_seq=1 Destination Host Unreachable
From 172.21.0.1 icmp_seq=2 Destination Host Unreachable
随后找到云平台,发现该机器状态是正常的,但是为啥无法ping通呢?
只能通过云平台登录到机器中进行排查
1、网络相关验证
直接执行命令验证ip的问题
ip a
或者ipconfig
进去之后直接验证,果然ip没了,因为之前有出现过这个节点的clickhouse崩了的情况,但是没有出现现在这个情况
无法判断具体情况的原因下,本着先解决当前的情况为主,就排查一下ip的问题了
验证网卡是否出现问题,
验证/etc/sysconfig/network-scripts/ifcfg-eth0
发现内容没有什么异常
随后直接尝试重启网络服务能否恢复
执行
service network restart
执行完成之后执行ip a发现ip恢复
随后回到堡垒机中进行排查
首先通过同网段机器发现当前节点机器已经可以ping通,随后进入该节点进行排查
能够发现确实是clickhouse这边的服务内存打满导致的异常(至少目前看到的情况是clickhouse是异常的)
进入clickhouse-client
报错:
Cannot load data for command line suggestions: Code: 241. DB::Exception: Received from localhost:9000. DB::Exception: Memory limit (total) exceeded: would use 45.52 GiB (attempt to allocate chunk of 4665408 bytes), current RSS 1.60 GiB, maximum: 23.27 GiB. OvercommitTracker decision: Query was selected to stop by OvercommitTracker.. (MEMORY_LIMIT_EXCEEDED) (version 24.9.2.42 (official build))
然后找相关异常的文章进行调整,
然后重启clickhouse之后服务恢复
随后各个指标也恢复正常
记录调整配置以适应内存不至于clickhouse崩溃(待观察)
由于本机器实例规格为8C16G,调整过大无法配合使用。再次调整
<clickhouse>
<!-- See also the files in users.d directory where the settings can be overridden. -->
<!-- Profiles of settings. -->
<profiles>
<!-- Default settings. -->
<default>
<max_memory_usage>5000000000</max_memory_usage>
<max_memory_usage_for_user>7000000000</max_memory_usage_for_user>
<max_memory_usage_for_all_queries>12000000000</max_memory_usage_for_all_queries>
<max_bytes_before_external_group_by>3000000000</max_bytes_before_external_group_by>
<max_bytes_before_external_sort>3000000000</max_bytes_before_external_sort> <!-- 3GB 后启用外存 -->
</default>
<!-- Profile that allows only read queries. -->
虽然当前已经正常,但是后续还需要对这个节点进行关注一下
感觉没啥用,崩了好几次~
已经决定回退版本观察一下是不是版本问题导致的~~
目测安装最新版本会有问题-目前已经将版本回退至24.2.1.2248版本
两天并没有什么问题出现
本文来自博客园,作者:Unfool,转载请注明原文链接:https://www.cnblogs.com/queryH/p/18561092
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须在文章页面给出原文连接,否则保留追究法律责任的权利。