修改ubuntu系统时区
摘要:ubuntu默认时区是Etc/UTC,和我们的北京时间相差8个时区,需要修改系统的时区,以下有两种简单方式修改系统时区: 1.修改/etc/timezone文件 vi /etc/timezone 把Etc/UTC改成Asia/Shanghai,然后保存(:wq),重启机器. 2.使用命令行交互界面修改. sudo dpkg-reconfigure tzdata 选择相应的时区. ubun...
阅读全文
posted @
2016-12-15 13:25
sanyuanyanjin
阅读(2722)
推荐(0)
ceph工作原理和安装
摘要:一、概述 Ceph是一个分布式存储系统,诞生于2004年,最早致力于开发下一代高性能分布式文件系统的项目。随着云计算的发展,ceph乘上了OpenStack的春风,进而成为了开源社区受关注较高的项目之一。Ceph有以下优势: 1. CRUSH算法 Crush算法是ceph的两大创新之一,简单来说,c
阅读全文
posted @
2016-12-15 13:11
sanyuanyanjin
阅读(2464)
推荐(0)
ceph运维常用指令
摘要:集群启动一个ceph 进程启动mon进程 service ceph start mon.node1 启动msd进程 service ceph start mds.node1 启动osd进程 service ceph start osd.0查看机器的监控状态[root@client ~]# ceph health HEALTH_OK查看ceph的实时运行状态[root@client ~]# ceph...
阅读全文
posted @
2016-12-15 12:43
sanyuanyanjin
阅读(539)
推荐(0)
Linux集群的总结和思考
摘要:前言:在涉及到对外项目,经手许多小中型网站的架构,F5、LVS及Nginx都比较多,我想一种比较通俗易懂的语气跟大家说明下何谓负载均衡,何谓Linux集群,帮助大家走出这个误区,真正意义上来理解它们。 一、目前网站架构一般分成负载均衡层、web层和数据库层,我其实一般还会多加一层,即文件服务器层,因为现在随着网站的PV越来越多,文件服务器的压力也越来越大;不过随着moosefs、DRDB+He...
阅读全文
posted @
2016-12-13 13:32
sanyuanyanjin
阅读(378)
推荐(0)
高可用可伸缩架构实用经验谈
摘要:移动互联网、云计算和大数据的成熟和发展,让更多的好想法得以在很短的时间内实现为产品。此时,如果用户需求抓得准,用户数量将很可能获得爆发式增长,而不需要像以往一样需要精心运营几年的时间。然而用户数量的快速增长(尤其是短时间内的爆发式增长),通常会让应用开发者有些吃不消,不得不面临一些严峻的技术挑战:如何避免因为单台机器当机导致服务不可用;如何避免在服务容量不足时,用户体验下降,等等。在系统构建之初就...
阅读全文
posted @
2016-12-13 13:30
sanyuanyanjin
阅读(180)
推荐(0)
大众点评运维架构
摘要:张冠宇在大众点评做运维架构师。他在本文中介绍大众点评整个的运维架构。目前他们的运维分为4个组,相信跟大部分公司一样,运维团队分为:应用运维、系统运维、运维开发和监控运维,当然还有DBA团队和安全团队。整个运维团队全算上目前是不到40人规模。 嘉宾介绍 张冠宇:花名关羽,目前在大众点评做运维架构师一职。在大众点评这几年时间,见证了点评运维从无到有,从低效向高效的转变过程。 分享内容 今天...
阅读全文
posted @
2016-12-13 13:29
sanyuanyanjin
阅读(852)
推荐(0)
统一监控报警平台架构设计思路
摘要:谈到运维,监控应该是运维的重中之重。怎么说呢?有很多人说这个监控应该是运维的第三只眼睛,一个好的监控平台对我们这个工作本身来说,应该有很大的帮助。那么,如何要构建一个完善的监控平台。那就是我们今天要讨论的话题: 以我的理解来说这个运维的核心工作其实是监控和故障处理。两个方面的工作首先是对这个业务系统我们要有一个精确的完善的监控。那么他的目的就是能够保证在第一时间去发现问题并且去通知相关人员解...
阅读全文
posted @
2016-12-13 13:28
sanyuanyanjin
阅读(4681)
推荐(2)
运维平台规划体系全介绍
摘要:识别运维平台的边界在哪儿,才能更好地构建平台,从而协助运维的日常工作。 在之前的文章中,谈到过“运维的本质——可视化”,在可视化的篇幅中,着重介绍自动化的可视化和数据的可视化;在后续的篇章中又介绍了“互联网运维的价值体系”,里面分解了几个维度:质量、成本、效率、安全等。以上都是为了清楚地梳理运维的内容边界,基于这个边界,我们再考虑如何进行平台支撑。可以说前两篇文章都是为今天这篇文章作为铺垫,...
阅读全文
posted @
2016-12-13 13:27
sanyuanyanjin
阅读(3121)
推荐(0)
中小公司统一用户认证方案
摘要:最近刚入职一家创业公司,因为账号问题各种发愁。以前所在的公司在这方面都很成熟,暂未遇到此类困扰。现将我在工作所遇到的问题分享出来,给大家借鉴与参考。现象: 开发账号混乱,GitLab、Jira、Confluence各一套账号,那叫一个乱 两个机房 VPN 两套,开发、运维、测试各种切换 WIFI 没有对用户做认证,只是统一密码连接 内部各种运营平台,各种密码对策: 公司...
阅读全文
posted @
2016-12-13 13:26
sanyuanyanjin
阅读(782)
推荐(0)
运维的目标价值体系
摘要:运维价值的提炼,直接决定了团队(个人)对运维理解的高度和精度!从很多传统的视角去看运维,运维的确承担了很多职能,但这些职能还是都和具体的岗位相关,如下:在过往的运维经历中,很多研发甚至是运维自己都把运维就放在了一个资源(服务器、网络)提供者定位上,造成很多运维团队的成就感不是很强。很多运维人也经常问,我们的价值到底在哪儿?“保姆”/“救火”/“苦逼”好像就是运维的标签,难道我们的运维真的只能如此?...
阅读全文
posted @
2016-12-13 13:24
sanyuanyanjin
阅读(5190)
推荐(0)
远离故障的十大原则
摘要:远离故障的十大原则提交我的留言加载中已留言故障是运维人员永远的痛。相信每一个运维人员的KPI中都有一项:可用性。可用性高就是不出故障,各个公司对可用性和故障评级的标准都不相同,但是避免故障的方法却是殊途同归。我们怎么避免故障,沃趣科技简单列举了以下几条,与大家共勉!1、变更要有回滚,在同样的环境测试过2、对破坏性的操作谨慎小心3、设置好命令提示4、备份并验证备份有效性5、对生产环境存有敬畏之心6、...
阅读全文
posted @
2016-12-13 13:23
sanyuanyanjin
阅读(422)
推荐(0)
运维平台之CMDB系统建设
摘要:CMDB是运维的基础核心系统,所有的元数据和共享数据管理源,类似于业务中的账号平台的作用。本篇文章,我将从概念篇、模型篇、到实现与实施篇具体的进行阐述。CMDB也称配置管理,配置管理一直被认为是 ITIL 服务管理的核心,因为其他所有流程均需要使用配置管理数据库 (CMDB)。在上篇的平台体系中,CMDB位于最底层的支持系统位置上,可见其作用。配置管理为什么起到核心的作用,这个地方不做逐一介绍,简...
阅读全文
posted @
2016-12-13 13:22
sanyuanyanjin
阅读(15664)
推荐(1)
运维平台之能力管理系统建设
摘要:能力管理的建设就是数据化IT服务的能力!能力管理(Capacity Management)应该是ITIL里面一个非常重要的概念,有些人叫容量管理,但我还是觉得能力管理更好一些,能力直接的理解就是我们能做什么?还有多少能力冗余?让我们来看看ITIL的概念解释,指在成本和业务需求的双重约束下,通过配置合理的服务能力使组织的IT资源发挥最大效能的服务管理流程,ITIL给到的流程图如下:从上图的中间部分可...
阅读全文
posted @
2016-12-13 13:21
sanyuanyanjin
阅读(1925)
推荐(0)
ITIL,是否已是昨日黄花
摘要:首先声明自己不是ITIL方面的专家,特别是具体的规范细节,后面论述如有不当,请指正。但我为什么会提起它?主要是因为它和运维(IT服务管理)相关性太大了。早起的运维完全就是以ITIL来蓝本构建的,在当时公司中还有ITIL学习小组/实践活动、ITIL的外部顾问培训等等。后来在YY的时候,当时实践CMDB、事件管理的时候,也是参照了其具体的规范和要求。我建议大家在讲ITIL的时候,一定要把ITSMF授权...
阅读全文
posted @
2016-12-13 13:20
sanyuanyanjin
阅读(24092)
推荐(2)
应用运维三部曲
摘要:应用运维三部曲,就是告诉你应用运维就该这么干!在日常的工作中,应用运维是否觉得自己很苦逼。比如说:是不是要值夜班?是是不是要不断应对需求?是是不是就是一个服务器者和应用发布者?是是不是要接受开发对我们不懂技术的质疑?是曾经有个研发想转运维,问是否要值夜班,如果是夜班的话,我就不转了。其实还真说明了一个事实,你做得好研发,还真不一定能做好运维哈。那我们一起来探讨一下如何做好应用运维,彻底改变以上大家...
阅读全文
posted @
2016-12-13 13:19
sanyuanyanjin
阅读(5004)
推荐(0)
可视化持续部署系统的设计与实现
摘要:持续部署(Continuous Deploy)的收益是全面的,体现在运维规范、自动化和团队合作等方面。一个完整的持续部署系统应该如何建设?本文给一个完整的思路和参考实现。一、持续部署的收益先来看一张图,图中的自动化部署系统就是持续部署部分。从环境的角度来说,持续部署需要对不同的环境进行部署,而不同的环境涉及到不同的角色,因此在这个平台之下都能带来自动化的效率收益。其次更重要的是,为了真正意义上的持...
阅读全文
posted @
2016-12-13 13:18
sanyuanyanjin
阅读(2265)
推荐(0)
运维自动化的最佳实践探索
摘要:运维自动化的一些认识和实践,包括如下八点:自动化需要整体规划自动化的基础是标准化首先从持续交付开始DevOps的四观善于借助研测的力量不一定强依赖CMDB以NO OPS为最终目标Docker等不是干掉运维以下为详细内容,敬请欣赏。1. 自动化需要整体规划没有整体的规划始终觉得运维是在建一个个的工具,没法形成递进式的实现策略。边界的识别是通过分层体系来构建DevOps自动化工具栈,而不是用一个工具解...
阅读全文
posted @
2016-12-13 13:17
sanyuanyanjin
阅读(951)
推荐(0)
Ansible 详细用法说明(二)
摘要:setup:获取指定主机的facts。===================================facts就是变量,内建变量 。每个主机的各种信息,cpu颗数、内存大小等。会存在facts中的某个变量中。调用后返回很多对应主机的信息,在后面的操作中可以根据不同的信息来做不同的操作。如redhat系列用yum安装,而debian系列用apt来安装软件。例:获取某台主机的变量ansible...
阅读全文
posted @
2016-12-13 13:15
sanyuanyanjin
阅读(1998)
推荐(0)
Ansible 详细用法说明(一)
摘要:一、概述运维工具按需不需要有代理程序来划分的话分两类:agent(需要有代理工具):基于专用的agent程序完成管理功能,puppet, func, zabbixagentless(无须代理工具):基于ssh服务完成管理,ansible, fabric二、简介 Ansible是一个简单的自动化运维管理工具,基于Python语言实现,由Paramiko和PyYAML两个关键模块构建,可用于自动化部...
阅读全文
posted @
2016-12-13 13:14
sanyuanyanjin
阅读(29411)
推荐(0)
Puppet基于Master/Agent模式实现LNMP平台部署
摘要:前言随着IT行业的迅猛发展,传统的运维方式靠大量人力比较吃力,运维人员面对日益增长的服务器和运维工作,不得不把很多重复的、繁琐的工作利用自动化处理。前期我们介绍了运维自动化工具ansible的简单应用,本期带来的是运维自动化神器puppet基于Master/Agent模式实现LNMP平台部署。Puppet简介Puppet是基于ruby语言开发的一种Linux、Unix、Windows平台的集中配置...
阅读全文
posted @
2016-12-13 13:13
sanyuanyanjin
阅读(397)
推荐(0)