摘要:
从IT运维到IT运营 主动式运维相比被动式运维,其关键在于从被动解决问题变为主动防控风险,在于持续总结优化,将运维活动延伸到系统运行全周期,形成改进闭环。 通过总结、反馈、优化等活动避免问题再次发生。 具体体现在从“从IT运维到IT运营”的转变。 传统的IT运维管理更多是被动式“维待',面向基础设施 阅读全文
摘要:
云计算架构 没有所谓最好的IT架构,只有最适合的IT架构,满足自身业务持续发展并且符合IT投资预算及整体发展路线,就是最适合的IT架构。 系统架构改造影响范围大,实施将是一个长期的过程,从外围自研业务开始,逐步到核心业务。 一、基础架构云管理平台:资源管理调度 实现IaaS层计算、网络、存储资源的调 阅读全文
摘要:
日志备份管理 作为历史数据的最终保存地,备份系统自身的可用性及数据存储策略显得格外重要。 如果实现本地数据双备份和重要数据跨机房复制后,那么在任何情况下均能保留一份可用副本。 关键要素 备份策略 过期时间 离线归档 恢复验证 数据分类 生产环境中备份数据可以归类为日志文件、数据文件、镜像文件等 日志 阅读全文
摘要:
1 - 趋势与本义 随着技术的发展, 基础设施和应用程序之间的界限会变得越来越模糊, "服务"管理也将变得更加全面和简单。 通过实施DevOps可以便捷地搭建包含交付流水线的研发协作平台,可以快速实现商业价值。 在这一过程中,反对将DevOps绝对理论化、模型化,而是坚持DevOps的实践性和灵活性 阅读全文
摘要:
应用系统评估 基本情况 应用系统配置信息完备程度 环境: 网络带宽、部署地点、部署机房等 硬件: 内存、硬盘、CPU等 软件: 操作系统、数据库、中间件等 文档: 开发文档、用户文档、产品文档等 服务: 业务服务时段、批量运行时间、停机维护时间、交易高峰时间等 应用:应用服务目录、应用支持系统、应用 阅读全文
摘要:
问题管理 问题的报告、受理、分派、督促、反馈、解决、跟踪、总结等工作过程 面对的问题 疲于解决重复性事件和问题 缺乏运维自动化:跟踪效率低,问题流转过程长; 流程性工作繁重:缺乏沉淀,难以形成问题库和深度挖掘分析底层原因和问题间关系 难以把控运维全局:不利于工作总结和持续优化 应用问题的一些基本定义 阅读全文