谷歌云 | 企业如何高效处理服务中断?Google Cloud 全面推出个性化服务状态监测

当云服务发生故障时,理解原因和影响至关重要,这样您才能制定行动方案并作出有效响应。去年8月,谷歌云推出了个性化服务状态监测,提供有关谷歌云服务中断时快速、透明和可操作的沟通,帮助企业更有效地应对事件

昨日,谷歌云宣布,包括计算引擎、云存储、所有云网络产品、BigQuery 和Google Kubernetes Engine 在内的50多项谷歌云产品和服务的个性化服务状态监测功能已全面上线。

个性化服务状态监测可以在各个谷歌云项目中启用和管理。它能识别所选项目中正在使用的谷歌云服务,并判断哪些事件最相关。您可以为组织中的单个项目或整个组织启用个性化服务状态监测功能

一旦启用,个性化服务状态监测功能就会开始处理并将相关事件发布到谷歌云控制台中的服务状态监测仪表板上。在仪表板上,您可以查看当前的服务中断,评估对您项目的影响,并跟踪最新动态。

如何使用个性化服务状态监测

当面临服务降级时,个性化服务状态监测应该是您事件响应旅程的第一步。它是检查新出现或活跃中断的首选谷歌云目的地,提供各种集成选项(例如,日志或警报),以简化您的事件管理工作流程。虽然个性化服务状态监测提供与您相关的最广泛的事件覆盖范围,我们建议使用公共状态仪表板,谷歌云服务状态监测作为备份,在那里我们会发布影响广泛客户群的大型事件。

1、通过主动报警发现事件

个性化服务状态监测会发出日志,并在发布或更新谷歌云服务中断时向多个目的地发送警报。您可以选择希望收到哪些警报,并自定义警报内容,包括关于事件的关键信息——包括受影响的 Google 服务和地点、当前对您项目的相关性、可观察到的症状和已知的缓解措施。从设置警报开始。您可以配置警报发送到一个或多个目的地,包括电子邮件、短信、Pub/Sub、网络钩子和 PagerDuty,或配置自定义条件来过滤您希望收到警报的事件。警报可以直接从个性化服务状态监测中创建,在云监控中创建,或通过 Terraform 创建。

2、管理相关服务中断

个性化服务状态监测旨在传达可能影响您并与您的项目相关的事件。个性化服务状态监测提供多个交互点:仪表板、API、日志和警报。每个交互点都提供可配置的过滤器,帮助您缩小希望跟踪或收到警报的事件集。例如,您可能希望接收特定谷歌云服务或地区的警报,或者接收您已确认影响项目的事件的警报。为此,您可以在我们的仪表板上查看事件时定义过滤器,或在创建警报时使用示例警报策略。

3、集成事件管理流程

个性化服务状态监测提供与您首选的事件管理工具和工作流程的多种集成选项。例如,您可以将警报与 PagerDuty 集成,以在服务中断开始时警告适当的事件响应者,或使用服务状态监测 API 与事件响应仪表板集成。

服务状态监测 API 提供对特定项目或组织中所有项目相关事件的编程访问。API 提供对所有相关事件、谷歌云的更新和影响描述的完整编程访问权限。您可以使用服务状态监测 API 请求事件,并在您的事件管理工作流程中使用该请求的输出。

如何开始:联系 Cloud Ace 云一

Cloud Ace 是谷歌云全球战略合作伙伴,多次获得 Google Cloud 合作伙伴奖。Cloud Ace 拥有 300 多名工程师,提供全方位的谷歌云服务,包括提供谷歌云、谷歌地图、谷歌办公套件、谷歌云认证培训和 VirusTotal 服务。

出海选择 Cloud Ace 云一,拓展全球商机!

 

posted @ 2024-01-19 18:11  CloudAce  阅读(2)  评论(0编辑  收藏  举报