乘风破浪,遇见现代研发运维(DevOps)之腾讯蓝鲸智云套件(Tencent BlueKing),从自研自用到开源赋能,开启智能化运维和高效研发迭代新时代

什么是蓝鲸

https://bk.tencent.com

image

蓝鲸智云,简称蓝鲸,是腾讯游戏运营部“腾讯智营”下的一个子品牌。它是一套基于PaaS的技术解决方案,提供了完善的前后台开发框架、调度引擎、公共组件等模块,帮助业务的产品和技术人员快速构建低成本、免运维的支撑工具和运营系统;是腾讯游戏运营部沉淀多年的技术运营支撑体系,承担着数百款业务线上运营的使命。

腾讯蓝鲸智云(Tencent BlueKing),简称蓝鲸,是腾讯互动娱乐事业群Interactive Entertainment Group,简称IEG)自研自用的一套用于构建企业研发运营一体化体系的PaaS开发框架,提供了aPaaS(DevOps流水线、运行环境托管、前后台框架)和iPaaS(持续集成、CMDB、作业平台、容器管理、计算平台、AI等原子平台)等模块,帮助企业技术人员快速构建基础运营PaaS。

image

传统的Linux等单机操作系统已发展数十年,随着云时代的到来,企业所需资源数暴增,操作节点(物理或虚拟服务器及容器)数量普遍达到数千个,大型互联网公司甚至达到百万级别,混合云模式成为常态,虽然IaaS供应商的出现从一定程度上解决了资源切割调度问题,但并未很好的解决资源与应用的融合,企业需要一种介于IaaS与应用(SaaS)之间的层级,用于屏蔽及控制IaaS,快速开发及托管SaaS,我们将其称之为基础PaaS层,并着重发展用于研发及托管企业内技术运营类SaaS的基础运营PaaS,并将其作为区别于传统OS的下一代企业级分布式运营操作系统。

企业IT应用的全生命周期可划分为研发运维运营三段,在各行业进行互联网化转型的过程中,融入敏捷思维,即形成持续集成、持续部署、持续运营的概念(CI-CD-CO)。

为降低转型成本,不以增加人力数量为转型前提,腾讯IEG以运维团队作为转型起点,充分利用这一群体低价值重复性工作量占比高的特点,从CD领域切入,以PaaS技术进行运维自动化领域的烟囱治理,形成运维PaaS体系。将自动化所释放的人力资源,转型为运维开发团队,利用PaaS的自增长属性,将运维PaaS逐步向CI及CO拓展,最终完成企业级研发-运维-运营基础PaaS构建,落地企业研发运营一体化。

image

目前,蓝鲸智云团队秉承着开放共赢的态度,正逐渐开放其自主研发的一套具有多项探索式创新的体系—蓝鲸智云软件体系。该套体系不仅提供了基础运维(发布变更、监控处理、数值调整、数据提取等)的无人值守服务,而且还给运维人员提供了解决方案(工具),并随时调整,避免重复性的操作服务。而运维人员则可以做些“用户体验优化”和“运营决策辅助”等运维增值工作,并且可以通过蓝鲸智云提供的集成平台,低成本的学习DevOps开发技能,进一步提升自己的能力,加速转型。此外,这套体系还可以运行轻应用、管理类、及职能类应用,是个全方位的运维、管理平台。

蓝鲸智云,运维领域的一张新名片,正在多个层次、多个领域崭露着头角,逐渐释放着自身特有的价值,引领着行业新标杆,开创了运维体系2.0的新局面。

成长历程

2021年

  • 4月社区版V6.0.3携手容器管理平台正式发布
  • 5月社区版产品使用视频教程上线
  • 6月持续集成套餐(蓝盾)上线
  • 6月问答社区全新改版
  • 7月2021年线上运维日之运维人的成长故事
  • 7月腾讯IEG研运平台通过首批IOMM研运数字化工具流程整合成熟度卓越级评估
  • 7月可视化开发平台上线

2020年

  • 1月社区版V5.1全新上线
  • 2月社区V5.1推新SaaS:ITSM(流程服务)
  • 3月V5.1mini体验版支持容器化部署
  • 7月第五届「7·24运维日」线上特别活动
  • 8月Gartner2020最新研究报告,蓝鲸获评中国AIOps代表!
  • 10月第二次校企合作蓝鲸高校SaaS开发培训课程开始
  • 10月腾讯蓝盾平台BK-CI获得本年度OSCAR开源治理评估结果的可信开源项目
  • 10月腾讯IEG技术运营部蓝鲸产品中心技术副总监刘章雄获得年度开源人物奖项
  • 10月第五届运维技术沙龙圆满成功
  • 11月社区版6.0开放下载
  • 12月社区版6.0首次系列直播公开课

2019年

  • 4月正式宣布开源“PaaS平台”和“标准运维”SaaS
  • 7月蓝鲸合作伙伴嘉为科技获得腾讯投资
  • 7月第四届「7·24运维日」技术沙龙
  • 9月腾讯蓝鲸智云开源,正式登陆码云Gitee
  • 10月与西安理工大学建立蓝鲸高校SaaS开发培训课程
  • 12月腾讯蓝鲸智云荣获「2019年最受欢迎中国开源软件」

2018年

  • 4月新版蓝鲸配置平台开源
  • 4月社区版4.0正式开放下载
  • 7月第三届「7·24运维日」技术沙龙
  • 8月社区版4.1正式开放下载
  • 8月运维开发必修课-Python运维开发实战上线
  • 10月社区发布标准运维和CICDKit
  • 11月国内首家通过工信部的研发运营一体化(DevOps)能力4级认证

2017年

  • 7月第二届「7·24运维日」技术沙龙

2016年

  • 3月蓝鲸微信服务号上线
  • 8月社区版V1.0正式上线
  • 8月蓝鲸荣获智能化商标(蓝鲸智云)
  • 12月社区版V2.0正式上线
  • 12月蓝鲸智云配置平台开源

2015年

  • 1月蓝鲸校园版上线

2014年

  • 1月腾讯游戏运营部50%以上运维使用蓝鲸SaaS

2012年

  • 1月蓝鲸首个版本上线
  • 2月蓝鲸SaaS框架诞生

核心优势

  • PaaS理念

软件的整个设计是基于PaaS理念,非侵入式地与企业已有的的系统结合,支持横向扩展。

  • 原子平台

底层由各原子平台组成,各平台专注于自身的功能建设,以便上层的场景类SaaS可以灵活、高效研发定制化系统。

  • 开放生态

不仅提供了丰富的API,而且在不断提升开放的力度,官方核心产品提供了插件式/二次开发(开源项目)的模式,促进运维生态发展。

  • 企业赋能

通过线上线下的公开课、认证考试、运维开发挑战赛等多种模式,赋能企业,提升企业技术能力,让企业员工具备自建系统的能力。

体系架构

腾讯蓝鲸智云体系由原子平台和通用的一级SaaS服务组成,平台包括管控平台配置平台作业平台PaaS平台等,通用SaaS包括节点管理标准运维日志平台监控平台故障自愈等,为各种云(公有云、私有云、混合云)的用户提供不同场景、不同需求的一站式技术运营解决方案。

image

腾讯蓝鲸智云体系依托企业级SOA、集成等理念,运用Docker等最先进的云技术构建起了全新的运维模式,致力于以“原子服务集成”和“低成本工具构建”的方式落地DevOps,帮助运维快速实现“基础服务无人值守”及“增值服务”,并进一步通过DevOps的落地实现企业更全面和可持续的效率提升。

三大领域

  • CI领域 - 面向研发的持续集成能力

一站式DevOps研发平台,从业务安全出发,贯穿产品研发、测试和运营的全生命周期;助力业务平滑过渡到敏捷研发模式,打造一站式研发运维体系,持续快速交付高质量的产品。

  • CD领域 - 面向异构业务的海量自动化运维的持续部署能力

腾讯游戏业务的复杂性和来自全球不同开发商业务之间的异构性,使得支撑团队必须提供一套完全松耦合于业务的海量运维管控与持续部署的解决方案。腾讯蓝鲸智云自主研发的管控平台,支持全球20W+主机节点的跨云管控,再配合配置管理、作业执行、容器管理、标准运维、故障自愈等能力,极大提升了运维自动化程度,进一步为业务的持续部署能力保驾护航。

  • CO领域 - 提升业务体验、辅助运营决策的持续运营能力

企业在不断发展的过程中,会催生出各类业务,每一款业务都值得去精细化运营,腾讯蓝鲸通过运维大数据平台的建设,让运维人员可以对业务大数据进行采集、清洗、分析、展示等,实现自动开合服,优化网络性能,预警系统故障等,不断提升业务体验,辅助运营决策。

版本类别

腾讯蓝鲸智云有2个主要版本线:社区版企业版,根据软件包的功能和技术服务提供方的不同,细分为软件基础包软件增强包合作商软件包。各版本的描述和产品内容详见下表:

版本类别 详细描述
社区版 可以从腾讯蓝鲸智云官方网站下载,并免费使用,用户以运维社区的个人/企业为主,通过社区力量,协助腾讯蓝鲸更好地验证产品的功能和性能。目前该版本的软件由基础平台(管控平台、配置平台、作业平台、PaaS平台)和官方提供的SaaS(节点管理、日志平台、监控平台、故障自愈、标准运维等)组成,且PaaS平台上可运行基于腾讯蓝鲸统一开发框架研发的各种场景SaaS。
企业版 企业版是付费软件,通过购买License的方式永久授权。用户以企业客户为主。其软件产品在功能、性能、服务等方面均优于社区版。蓝鲸的“企业版技术合作伙伴”为软件销售和实施的授权方。

版本功能差异

类别 社区版 软件基础包 软件增强包 合作商软件包
管控平台 -- --
配置平台 -- --
作业平台 -- --
PaaS平台 -- --
故障自愈 -- --
标准运维 -- --
监控平台 -- --
日志平台 -- --
流程服务(原ITSM) -- --
容器管理平台 -- -- --
持续集成平台(蓝盾) -- -- --
网络管理 -- -- --

版本服务差异

类别 社区版 企业版软件基础包 企业版软件增强包
是否收费 免费 License永久授权 License永久授权
服务时间 工作日9:30-12:00,14:00-18:00 在线客服 7*8h 工作日9:30-12:00,14:00-18:00
培训服务 免费在线培训 企业内部培训 企业内部培训
通用SaaS 基础功能SaaS 基础功能SaaS 基础功能SaaS
高可用方案 支持 支持
API 无限制(6.0.3+) 无限制 无限制
监控保障 基础监控服务 企业标准监控服务 企业标准监控服务
官方技术保障 通用技术支持 专家技术支持 专家技术支持

企业商品购买

image

原子平台

  • 管控平台

蓝鲸管控平台是蓝鲸体系的底层管控系统,是上层运维服务体系与底层IaaS的连接器,为上层提供指令、文件、数据的通道,支持直连模式、代理模式以及为达到最优连接指定级联路由的模式。管控平台是典型的两层分布式C/S结构,主要包含智能的蓝鲸Agent、提供各种服务的Server以及ZooKeeper、Redis、MySQL等周边保障模块。其中蓝鲸Agent是部署在业务机器上的程序,每台业务机器仅部署一个蓝鲸Agent,其他模块部署无具体要求,用户可以单独部署,也可以混合部署

在整个蓝鲸体系中,管控平台无需直面用户,但其在体系中却是不可或缺的,它为其他平台模块提供了人机交互的通道与能力。管控平台主要提供了三种类型的服务能力:文件分发传输能力、命令实时执行与反馈的能力、大数据采集与传输的能力。

  • 配置平台

蓝鲸配置平台(CC)是一款面向应用的CMDB,在ITIL体系里,配置管理数据库(CMDB)是构建其它流程的基础,配置平台作为面向业务层面的CMDB,为蓝鲸体系的其它平台提供了各种运维场景的配置数据服务,存储与管理企业IT架构中设备的各种配置信息,它与所有服务支持和服务交付流程都紧密相联,支持这些流程的运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性。配置平台提供的主要功能有主机管理、业务拓扑、业务管理、资源池管理、自定义属性管理、操作审计等

  • 作业平台

蓝鲸作业平台(Job)是一套底层基于管控之上的基础运维操作平台,并且具备海量的并发处理能力,除了支持脚本执行、文件拉取/分发、定时执行等一系列可实现的基础运维场景以外,还运用流程化的理念很好的将零碎的单个任务组装成一个作业流程。同时,可通过平台提供的API实现对任意作业的调用、查看等操作,与其它平台或系统联动,实现调度自动化。作业平台的主要功能有:快速传输文件、web化脚本管理、支持批量高效执行、流程式管理,一切皆“作业”等。

  • PaaS平台

蓝鲸PaaS平台是一个开放的平台,又称蓝鲸PaaS,让用户可以简单、快速地创建、部署和管理应用,他提供了完善的前后台开发框架、服务总线(ESB)、调度引擎、公共组件等模块,帮助用户快速、低成本、免运维地构建支撑工具和运营系统。PaaS平台为一个应用从创建到部署,再到后续的维护管理提供了完善的自助化和自动化服务,如日志查询、监控告警等,从而使用户可以将全部精力投入到应用的开发之中。PaaS平台的主要功能有:支持多语言的开发框架/样例、免运维托管、SaaS运营数据可视化、企业服务总线(API Gateway)、可拖拽的前端服务(MagicBox)等

  • 容器管理平台

蓝鲸容器管理平台是一个用于支撑业务容器化及微服务化的平台,是一种DevOps实践。蓝鲸容器管理平台提供了持续集成、持续构建、持续部署的具体实现,并在此基础上,构建了分布式配置管理、服务发现、仓库管理(兼容JFrog与docker hub)、安全健康检查、网络配置服务等主要功能。蓝鲸容器管理平台会以SaaS服务的形式提供交互,用户只需通过页面点击就能完成业务镜像的构建、发布等操作。

  • 移动平台

蓝鲸移动平台借助微信公众号解决方案,整合蓝鲸的功能特性,助力运维最大化提高工作效率和便捷性,已支持用户在手机端管理/执行作业任务、创建/修改定时任务等操作,真正做到“工作・生活,弹指一瞬间”。

场景SaaS

  • 节点管理

一款设计用于在浏览器端进行后台服务管理的的应用。目前的版本中,支持gse_agent的安装与升级,满足用户直观简便的在受控主机上部署Agent及管理GSE插件。

  • 日志平台

蓝鲸智云日志平台是为了解决运维场景中查询日志难的问题而推出的一款SaaS,基于业界主流的全文检索引擎,通过蓝鲸智云的专属Agent进行日志采集,无需登录各台机器,集中管理所有日志。

  • 监控平台

监控平台是一款针对主机和互联网应用进行监控的产品,监控服务可用于收集主机资源(系统性能、组件服务、数据库、日志等)的监控指标,探测互联网应用服务的可用性,并对指标进行告警设置。

  • 故障自愈

故障自愈是一款实现服务器故障自动处理的解决方案,提升企业服务可用性和降低故障处理的人力投入。通过自动化处理来节省人力投入,通过预定的恢复流程让恢复过程更可靠,通过并行分析达到更快的故障定位和恢复,最终减少业务损失的风险。

  • 标准运维

标准运维是通过一套成熟稳定的任务调度引擎,把在多系统间的工作整合到一个流程,助力运维实现跨系统调度自动化的SaaS应用。

软件包类别

软件包类别 详细描述
基础包 基础包是企业内落地自动化运维解决方案的基础软件,包含基础平台(管控平台、配置平台、作业平台、PaaS平台)和官方提供的SaaS(如:节点管理、监控平台、故障自愈、标准运维、日志平台、流程服务(原ITSM)等)。
增强包 增强包是更高级的运维产品的集合,必须基于基础包一起使用。如:容器管理平台、持续集成平台等,目前已对外开源,蓝鲸官方仅提供开源社区的更新服务。合作伙伴可根据企业需求,自行从开源社区获取源代码包提供给客户使用。
合作商软件包 合作商软件包是由腾讯蓝鲸合作伙伴提供的运维解决方案场景类的产品,如网络管理等,该类产品可在已有基础包的前提下,以“插件”的方式,面向用户提供更多功能场景。由于开发者/技术服务提供方均非腾讯蓝鲸团队,涉及到合作、销售、推广等事宜需要与软件提供方商榷。

交流渠道

群名 QQ号 用途
蓝鲸社区版交流1群 495299374 社区问题综合群,处理社区版的通用类问题,部署、开发、咨询等
运维开发群 878501914 SaaS开发、标准运维、PaaS平台等开源项目交流群
CMDB开源群 305496802 蓝鲸配置平台开源项目交流群
bk-ci技术交流区 744672165 蓝鲸bk-ci开源项目交流分享群
标准运维社区用户群 861919432 蓝鲸标准运维社区用户交流群

交流论坛

https://bk.tencent.com/s-mart/community

能力认证

为了保障腾讯蓝鲸智云软件在企业内快速落地,得到稳定有效的运行,腾讯蓝鲸智云在对外输出产品的同时,对给企业提供服务的人员按照其具备的能力进行有效的考核与认证。此类认证考试统称为“腾讯蓝鲸智云工程师系列认证”,是针对运维自动化和运维开发领域的专业人员,在中国信息通信技术研究院(中国信通院)的指导下,由云计算开源产业联盟和腾讯公司共同颁发的资格证书

image

蓝鲸智云认证系统进行报名,考生按照指引报名即可。客户可以前往"认证动态"(https://bk.tencent.com/training_exam/)查询服务工程师的能力,也可以主动要求提供服务的工程师出示证书。

  • 腾讯蓝鲸智云-运维自动化工程师(BKOS)认证

Tencent Blueking Operations Specialist(BKOS)

  1. 腾讯蓝鲸智云-运维自动化工程师(BKOS)认证-服务认证

服务认证需要工程师通过全部考试科目(理论基础、软件部署、产品使用),持有此类证书的运维自动化工程师才可以给客户提供整体的服务,包括软件部署、维护、接入以及SaaS开发。

  1. 腾讯蓝鲸智云-运维自动化工程师(BKOS)认证-使用认证

使用认证需要工程师通过2个考试科目(理论基础、产品使用),持有此类证书的运维自动化工程师仅可以给客户提供软件使用的培训和指导服务,包括企业内部熟练接入各平台产品,及使用官方SaaS满足自有场景。

说明:本指南中若提到运维自动化工程师的持证人员,无特殊备注,则默认为“服务认证”。

  • 腾讯蓝鲸智云-运维开发工程师(BKDS)认证

Tencent Blueking Development Specialist(BKDS)

持证人将具备根据企业场景,快速开发运营/运维系统的能力,通过工具文化,提高企业办公效率。

说明:腾讯蓝鲸专家技术支持服务,仅开放给通过认证的人员,各合作伙伴由持证人发起客户问题的咨询与沟通。获得认证的工程师人数越多,则代表该合作伙伴的技能指数越高。

客户案例

image

蓝鲸寄语

运维行业发展阶段有:手工操作 > 脚本自动化 > WEB自动化 > 调度自动化 > 智能化运维,目前很多公司的运维同仁尚处于“脚本自动化”阶段,而蓝鲸智云团队已经完全经历了前四个阶段的洗礼,正在积极地拥抱智能化运维带来的福利。

为了给运维行业提供更好的服务,蓝鲸智云团队从2016年3月启动开放计划,并且不断加大开放力度,甚至是开源。目前已经开放了社区版6.0,其功能特性可以让运维同仁直接进入“调度自动化”的阶段,通过提升自身能力,低成本地构建运维工具,自建运营系统

2016年12月16日,腾讯游戏蓝鲸产品中心负责人党受辉发布了“蓝鲸智云”品牌的宏大愿景「改变中国运维行业」。未来,蓝鲸将继续建设和维护社区版,打造蓝鲸开发者社区、SaaS市场、脚本社区等丰富的运维生态。

运维行业是一片蓝海,蓝鲸智云团队希望能和优秀的企业一起合作,为合作伙伴提供技术支持,蓝鲸将更专注于技术研究,持续输出更多的产品,一起为运维行业服务。

源码仓库

获取蓝鲸

Docker版本

https://hub.docker.com/u/blueking

参考

posted @ 2022-03-20 17:31  TaylorShi  阅读(1438)  评论(0编辑  收藏  举报