“去O”已经out—对话阿里云数据库专家

2016-12-28 21:19余文
计算机产品与流通 2016年8期
关键词:运维阿里数据库

余文

“我相信很多人都在谈‘去O,但是我觉得单纯谈‘去O就有点out。”众所周知,去IOE这个词汇是阿里云提出来的,因此当笔者在北京云栖大会上听到阿里云数据库产品专家、PostgreSQL中国社区主席萧少聪说出上述这句话的时候,难免大吃一惊。

“我们更应该从公司业务的角度,分清楚这些业务应该有哪几种模型,根据这样的模型,把原来按照系统上线的数据库重新打散、拆分;按照不同的模型选用不同的产品,去解决今天的新问题,形成一个新的架构。”很明显,萧少聪的本意是从行业应用和DBA(数据库管理员)未来发展的视角来看待”去O“这件事。

改变传统商业模式

众所周知,DBA是任何一家上线数据库系统的企业的标配。这是因为,数据库是企业的核心资产,而且在交易型业务里,数据库承载着一天24小时,一年365天不间断的关键业务的运营。比如银行交易系统,或者企业的生产系统,一旦宕机,都会造成无法估量的损失。

打个比方,一个上线的交易型数据库就好像空中飞行的飞机发动机,出现任何故障谁都承担不起,更别说在飞行中更换发动机了。

相对于硬件产业链上下游较为成熟的分工合作方式,软件提供商由于没有硬成本的压力,因此绝大多数软件都采用了迭代开发的模式,一个产品的成熟通常需要很长的周期—即便是广泛应用到金融、电信等大行业的以“高可靠、高可用和高稳定”自居的Oracle数据库,往往在一个大版本的头一两个小版本,也会存在相当多的bug。

也正因为此,目前全球市场上较为成熟的大型商用关系型数据库仅有 Oracle、IBM、Sybase、微软SQL Server、Informix等五款,再加上新近受到市场热捧的SAP混合交易分析型数据库HANA,因此去“O”要远比去“I”或者去“E”难得多。其实,“去O”或者去“IOE”并不是针对某一家或某几家企业,而是更多针对传统的IT商业模式。

众所周知,传统的企业级商用软件的商业模式,不仅在采购初期收取软件许可的费用和实施上线的费用,还要在每一年再收取接近采购价格20%的服务费,用于产品升级和系统维护。

但如今,云计算真正颠覆了这一模式。这也是为什么Oracle创始人拉里埃里森近期一改几年前对云计算的不屑,拼命转型云计算的原因。

“去O”副产品—公云运维自动化

云数据库的兴起,源于大型电商如亚马逊、阿里巴巴等出于自身大型数据中心中运营的庞大数据库所需支付的高额运维成本的考量,不得不自行研发低成本的硬件基础架构和开源数据库系统。也正因为此,诞生了公共云服务供应商AWS、阿里云。

当然,数据库的研发不是一蹴而就的—无论是AWS还是阿里云,其背后都依托着亚马逊、阿里巴巴这样的巨型电商的各种资源的支持,并且经历了双十一、圣诞节等时段交易量爆炸式增长的考验,才得以逐步成熟,并且开放提供商用云数据库服务。

在这一从起步到成熟的成长过程中,数据库运维服务,也正在从人工修复,到通过软件定义的方式,形成自动化运维的体系,大大提高系统稳定性的同时,降低了手工操作的必要性。

“最初我们的DBA们一直在救火,后来我们逐渐有了能力不用到处救火了,因为部分系统已经完成自动化运维的工作。”阿里云关系数据库服务内核开发和运维团队负责人丁奇坦承,“刚开始部署自动化运维的时候,大家到了双十一的时候,坐在那里还是很慌。这种情况一直到去年底彻底改变。所以我们今年的目标是双十一不用再担心系统运维了,不用再通宵在七楼值班了。”

丁奇说的很务实。

事实上,如今阿里云内部的ApsaraDB云数据库大约运行着三百多个业务,已经基本实现自动化运维,整个工作只有一个DBA在看管—IT运维的绝大部分的工作已经交由系统来完成。

阿里云关系数据库服务内核开发和运维团队负责人丁奇(右)和阿里云缓存数据库负责人、Redis中文社区的核心发起人子嘉(左)与笔者对话

据悉,为了达成今年双十一自动化运维的目标,丁奇设立了全新的机制。“我们把系统集群当成我们的客户来对待,设立了健康指标。”丁奇解释说,“我们每天都在进行业务优化,但我们要知道业务优化的进展,比如我们限定双十一的时候,健康指标要超过95分,那我们每个月一次去给这个集群打分,建立每个月的进度任务,就可以更容易地达成目标。”

DBA的新追求

很明显,核心数据库运维的自动化,开始让DBA这个职业变得可替代。

“如今底层的IT运维服务,已经通过公共云或者软件定义的方式,大大降低了手工操作的必要性,自动化运维逐步成为现实,而DBA们未来的出路就在于对公司业务、行业知识,与IT技术的结合。”萧少聪表示。

据悉,阿里云内部的DBA,尤其是那些对业务熟悉的DBA正在变得越来越抢手。“这些DBA并不是基础做得好,并不是扩容加机器加得特别快,而是他最了解业务,他能够去以一个数据架构师的方案推动业务的改造。”在萧少聪看来,“这才是他们核心价值,也是DBA目前能够持续增长的价值。”

记得以前业界有个说法,就是阿里云的运维靠人垒,而某云拿这个说事儿,说自己早已实现自动化运维。当时笔者并没有很在意,因为谁都知道,双十一的量级是多少?换谁也都得铺人上去。

没想到,如今阿里云不仅已经可以基本实现自动化运维了,而且,DBA们正在转型和升级。不仅如此,就连阿里云ApsaraDB也在转型升级。这就是为什么本文开篇,萧少聪所说的,单纯谈“去O”已经out了的原因。

“阿里云正在数据库的新领域投入研发并稳步推进—HTAP是我们现在攻关的一个大方向。”丁奇介绍,阿里云的分析型数据库GreenPlum已经在公测,未来还会推出名为“小数仓”的相关产品,目的就是帮助传统的OLTP用户,在一个系统里面实现数据的读写和计算分析,实现数据在内部系统之间实现平滑流转。

实际上,对于业务应用来说,云并不能解决传统IT架构应用孤岛的问题,而这个问题的关键其实就出在数据库上。

众所周知,系统的核心是数据库,而每个业务系统都是独立上线,不论业务系统是否上云,还是本地的,其数据库之间都是割裂的。更重要的是,一家企业中最关心数据的各个老总,原先看到的报表,都是分析型数据库中月结的静态数据,无法支持老总及时调整销售战术。

这样的状态,是因为HTAP(Hybrid Transactional/Analytical Processing),即混合交易/处理的模式长期不为业界看好—因为要实现分析查询足够的速度,以防止分析工作负载,从中断操作处理。为了实现分析查询的足够的速度,OLTP(在线事务处理)的数据通常从一个或多个操作系统复制到数据集市或数据仓库,再进行OLAP(联机分析处理)。

而今,随着硬件技术的不断成熟,特别是HTAP的代表——SAP HANA得到广泛成功应用之后,数据库的技术发生了重大改变。如果真正想让数据活起来,就必须让OLTP与OLAP统合起来,这样,任何分析报表所抽取的数据都可以从实时变化的动态的OLTP中来进行分析展现。

这就是为什么,阿里云DBA们今天真正关心的是与业务挂钩。

在笔者看来,云栖大会北京峰会上的亮点,除了阿里云推出全新的品牌形象,表达“生于代码”的本源和满足海内外市场的发展需要之外,对数据库的一些新动作,包括自动化运维、开源AliSQL、研发HTAP等,都将对数据库行业、DBA职业的发展,以及软件行业商业模式和企业用户的管理模式产生重大影响。

猜你喜欢
运维阿里数据库
云上阿里
基于GPS的电力运维轨迹定位系统
IT运维管理系统的设计及应用
疼痛后才计数
Catalan数及几种应用实例
数据库
拳王阿里因何被人铭记
数据库
数据库
数据库