摘要: 背景 IT运维领域要保障服务正常运行,通常第一步是将运维的对象监控起来,这其中主要就是对运维对象的指标进行实时监控:通过设定的(算法)规则对指标进行实时检测,当某个指标值不符合设定的规则时,则判定为异常,然后发送相应的告警到告警平台。在告警平台收到告警后,会分配给对应的运维人员进行处理,运维人员去根 阅读全文
posted @ 2023-12-15 18:07 故君子慎为善 阅读(342) 评论(0) 推荐(0)
摘要: title: python如何读取大文件 date: 2022-05-16 19:30:00 tags: - 面试问题 - 大文件 categories: - python 楔子 在一次面试过程中,主考官提出了问题:如何使用python读取大文件 而我一般知道: 1.一般读取、操作文件都是整体读取到 阅读全文
posted @ 2023-12-15 18:06 故君子慎为善 阅读(282) 评论(0) 推荐(0)
摘要: title: 自动化日志解析/模板化的工具及平台介绍 date: 2022-05-19 19:30:00 tags: - 日志解析 categories: - AIOps 楔子 日常工作查找资料的过程中发现了2019年的一篇论文,对日志解析的工具和使用情况进行了详细的统计和对比,对于了解日志解析/模 阅读全文
posted @ 2023-12-15 18:06 故君子慎为善 阅读(935) 评论(0) 推荐(0)
摘要: title: python中的GIL是什么 date: 2022-05-18 19:30:00 tags: - 面试问题 - GIL categories: - python 楔子 一直听说GIL是python的弱点,工作过程中也只了解个皮毛,偶然看到一篇外文讲的很好,因此翻译搬运到这里,如有不足, 阅读全文
posted @ 2023-12-15 18:06 故君子慎为善 阅读(19) 评论(0) 推荐(0)
摘要: title: pandas如何对每行进行操作(apply函数用法) date: 2022-05-11 19:30:00 tags: - pandas categories: - 问题解决 - pandas 楔子 在对dataframe做处理时,有个需求需要对dataframe的每一行的不同列进行操作 阅读全文
posted @ 2023-12-15 18:05 故君子慎为善 阅读(727) 评论(0) 推荐(0)
摘要: 背景 随着科技的不断发展,软件系统规模愈发庞大,复杂度日益提升,组件和应用间的联系也更加紧密。海恩法则(Heinrich's Law)指出: 每一起严重事故背后,必然有29次轻微事故和300起未遂先兆以及1000起事故隐患。在系统发生故障之前,通过先兆告警通常可以防患于未然,提前的排查事故隐患。而当 阅读全文
posted @ 2023-11-30 20:22 故君子慎为善 阅读(354) 评论(0) 推荐(0)
摘要: 背景 随着科技的发展,时序数据在我们的认知中占据越来越多的位置,小到电子元件在每个时刻的状态,大到世界每天的新冠治愈人数,一切可观测,可度量,可统计的数据只要带上了时间这个重要的因素就会成为时序数据。在运维领域,时序数据的范围则缩小到软件系统及其关联事物上面。随着数字化,物联网,人工智能等新技术的蓬 阅读全文
posted @ 2023-11-22 15:42 故君子慎为善 阅读(178) 评论(0) 推荐(0)
摘要: AIOps中的日志数据应用 背景 随着科技的不断发展,日志数据在软件系统的各个领域中扮演着越来越重要的角色。它记录了系统中的事件、活动和状态,为我们了解系统提供了宝贵的信息。 在运维领域,日志数据对于监控和维护系统的正常运行至关重要。通过收集和分析日志数据,运维团队可以追踪系统运行状况、检测问题和异 阅读全文
posted @ 2023-11-22 15:41 故君子慎为善 阅读(548) 评论(0) 推荐(0)