目前云计算运维工程师前景如何?
云时代的运维
从服务器管理、操作系统管理、网络配置到大型集群、大数据框架、虚拟化 。
运维的工作在快速变化着。
在这个万物皆可云的时代,运维工程师又该何去何从呢?
更新的技能要求
如今,作为一名运维工程师最重要的是快速发现问题和解决问题的能力,0故障率 是最终的目标。
除此之外,还要具备以下几点:
- 对操作系统结构及原理的掌握是重中之重,熟悉网络通讯协议 (TCP/IP、HTTP),也是日常工作的必备 技能。
- 能够正确选型并使用Ganglia、Nagios、Zabbix等监控工具,做到对业务系统运行状态了如指掌。
- 熟悉Hadoop、Hbase、Storm等分布式计算或存储系统,具有K8S、docker等容器化工具的运维管理能 力。(毕竟大数据时代了)
- 至少精通Shell、Python、Perl等一种编程语言,完成日常运维脚本的开发。 有自动化工作意识与思维,把一切重复人工劳动自动化。要求对常用的数据结构 和算法有一定的了解,并 能够灵活运用到日常的工作中。
- 另外,时间管理能力,特别是碎片化时间的处理能力和团队沟通协作能力可以作为加分项。
- 运维人的日常
- 在服务出现异常时尽可能快速的恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因,推动 并修复服务存在的问题,设计并开发相关的预案以确保服务出现故障时可以高效的止损;
- 设计并开发高效的监控平台和告警平台 ,对系统中的大量监控数据进行汇总分析,以及在系统出现异常的 时候可以快速的发现问题和判断故障的影响;
- 以可控的方式,尽可能高效的完成产品功能的迭代的变更工作;
- 通过构建自动化的平台确保每一次版本变更可以安全可控地发布到生产环境;
- 通过技术手段模拟实际的用户请求,测试整个系统所能承担的最大吞吐;
- 通过建立容量评估模型分析压力 测试过程中的数据以评估整个服务的容量;
- 基于评估数据,判断系统的瓶颈并提供优化的解决方案,比如通过调整系统参数、优化服务部署架构等方 法来高效的提升系统容量。
何谓“高水平”?
- 保证服务可用性达到一定标注,如99.9%;(其实想写6个9,怕挨揍)
- 日常工作自动化 程度占比,如65%以上;(还在ftp上传jar的小伙伴,要不要为了“学到东西”动一 下???)
- 状态类的监控或统计分析报告的设计与分析,如服务瓶颈、性能问题、异常流量 、攻击等问题;
- 各类操作、说明等文档的完备性,80%以上;

浙公网安备 33010602011771号