Enable javascript in your browser for better experience. Need to know to enable it? Go here.
Perspectives edition 10 banner
Perspectives edition 10 banner

掌握云技术:在危机中及其之后提高企业韧性的关键

 

 

变革速成课

如果需要提醒企业在变化无常的情况下迅速采取行动的能力有多么重要,那么新冠肺炎疫情的确做到了这一点。


疫情及其经济影响几乎在一夜之间颠覆了早已既定的商业模式、供应链和消费模式。一些企业被迫应对激增的需求,而另一些则面临需求骤降的局面。随着人们被迫更多地进行线上互动和交易,技术资源变得异常紧张。随着疫情加重,网速变慢和网络中断的情况变得频繁,前所未有。许多国家或地区的企业和劳动力一直忙于处理这些状况。企业对灵活云端计算架构及其弹性和响应性的需求从未如此高涨。

全球网络中断事件

Diagram - Global network outage events Diagram - Global network outage events

来源: Thousandeyes

尽管疫情带来了许多困扰,但大多企业都认同:这不是他们可能面临的最后一次危机。如果不是疫情,有些原本在许多方面已经存在的压力也许更容易被忽视。事实上,企业当然必须做好应对变革的准备。


无论是在技术、监管、竞争格局或是客户期望方面,变革之快速都意味着任何企业都时时需要管理转型,并以几十年前难以想象的程度适应变革。从这个角度来看,云不仅提供了弹性,确保组织能够抵御疫情及其后果,也带来了速度、灵活性和协作能力,这些都是数字商业环境多年来一直需要且未来将提出更高要求的能力。但掌握这些能力需要付出代价;云需要大量持续投资并建立明确策略。但最先采用云的企业已经证明,企业最终可以从这些投入中获得竞争优势。

为什么云(有时)会出错

如果云发挥作用,结果自然皆大欢喜。不过,尽管使用云的企业越来越多,有些也大获成功,但我们必须承认,云投资未必总能带来预期的效益。因此,有必要对此作出警告。


研究表明,多达三分之一的企业认为,上云为组织带来的改善很少甚至没有。某些情况下,云产生的问题可能比解决的问题更多。最近一项研究中显示,74% 的企业曾经将应用程序迁移到云端,但由于担心安全和性能问题,之后又将应用程序迁回企业内部的基础设施。

将应用程序迁出云端的组织

Diagram - Organizations that moved applications back from the cloud Diagram - Organizations that moved applications back from the cloud

来源: IHS Markit

然而,疫情爆发后,一些企业(例如网飞或 Zoom)也因为能够轻易在几乎一夜之间利用云将需求扩展到前所未有的水平而脱颖而出。


那么,云采用者区别于以云为中心的企业以及可靠的云战略与失败的战略之间的差异因素是什么呢?Thoughtworks 专家认为,有几条指导原则是导致这一差距的基本因素。

云不仅仅是基础设施

许多与云相关的困难都源于一个常见的错误观念。由于许多组织最初是因为看中其无限的存储和处理能力而采用云,因此这些组织便将云默认为内部硬件的直接替代品。Thoughtworks 云实践负责人及《基础设施即代码》一书的作者 Kief Morris 指出,由于上述原因,进行云迁移时,“企业倾向于认为云迁移是基础设施团队的责任,因此将这项工作交由技术设施团队来负责。”


但实际上,采用云架构还涉及除基础设施以外的更多组织团队。如果企业无法针对资源更多变的环境来优化软件、网络、系统和实践,就很可能会在新的云环境中再次遭遇已有的瓶颈。


Thoughtworks 澳大利亚公司技术总监 Scott Shaw 表示:“云不仅仅是将基础设施从本地环境迁移到不再需要维护的虚拟环境。因为云的一切都是软件定义的,所以你必须把云作为软件来管理。你仍然需要掌握所有关于网络、安全和基础设施的知识。但是你必须使用软件工程方法而非基础设施方法来管理云。”


因此,云不是一次性的过渡,而是个持续的过程。尽管云供应商提供了关键技术,但组织需要自行确保其系统和应用在新环境中能够表现出色。


Morris 表示:“软件会对其运行的基础设施类型做出假设。而云的出现增加了不确定性。为云环境开发的软件能够在新基础设施上运行,即使这类软件并未提前为新环境而做准备。为云环境开发的软件是获得规模优势的关键,因为即使你将老旧的软件放到云端,它也无法奇迹般地按照预期将服务器容量拓展到原来的五倍。软件会假设有人会对其进行手动安装。”


Shaw 补充说:“很多投资于云环境的企业缺乏我们通常认为与关键业务型资产相关联的工程实践,也就是测试驱动的开发、模块化、抽象、封装、版本控制、持续集成。如果你希望长久保持资产的最佳状态,所有这些实践都可以且应该应用于基础设施自动化。”

云的能力

Thoughtworks 数字平台战略总监 Ryan Murray 表示,关于云最正确的观念是,应该跳出超大存储空间或服务器时间单位的概念,将云看做“一项实现技术能力组件化的整体方法,能够让开发人员更快构建软件,并消除因技术能力而产生的大量运营管理负担。”


云的部署和管理方式都经过优化,不仅能提升计算能力,还能拓宽了企业能力的界限。Thoughtworks 首席咨询师 Ranbir Chawla 表示:“使用云的主要好处是可以实施新的运营模式。”


虚拟化就是很好的一例。云最基本的功能是可以通过将大型主机虚拟化,减少所需的维护工作或物理空间。但我们为何不更进一步,将同一台主机多次虚拟化。如此一来,企业原本在可同时建立和管理的应用数量方面的局限就突显出来了。

 

传统架构与虚拟架构

Diagram - Traditional vs. Virtual Architecture Diagram - Traditional vs. Virtual Architecture

来源: whatis.com

Chawla 表示:“这样做的好处在于,你可以开始考虑实体基础设施无法实现的创新性版本和软件开发周期。“然而,有些企业没能发挥虚拟化的优势,有些则是没有能力开展这方面的尝试。”


Chawla 补充说,云为企业带来“通过了解数据解锁未来业务的绝佳机会”。越来越多的云供应商正在开发让企业按需访问人工智能和机器学习解决方案的平台,提供企业自身可能无法实现的“即插即用”组件使用方法。Chawla 表示:“机器学习和人工智能很难在本地实施,这需要知识,需要硬件,是一套不同的技能。但在云端,机器学习和人工智能几乎触手可及。”


在云端使用机器学习和人工智能能为更多数据驱动的开发方法铺平道路,利用这些开发方法,企业可以无缝收集客户反馈、分析客户反馈并将其直接转化为产品改进甚至新产品。如此一来,企业可以提前识别出客户趋势或市场趋势。在局势不稳时期,这种预测性智能可以迅速成为企业最大的资产。

推动组织变革,实现压力之下的生产力

然而,如果不能围绕云环境重新调整团队和工作流程,企业就无法实现上述优势,也无法确保能在关键时刻让云的快速和灵活性发挥作用。要实现云原生,就需要实施组织变革和技术变革。


进行技术治理。如果企业将管理云的工作完全交给基础设施团队,有些基础设施团队可能会退回到诉诸于控制访问本地数据中心的做法,直接扼杀获得任何潜在收益的可能性。


Chawla 表示:“我们已经让客户花费数百万美元投资云或者购买 API 驱动的云原生软件,然后却让一整个团队和相关限制阻止人们访问这些系统。客户因此而突然失去了创新、即时获取、尝试等等所有好处。”


企业可以通过加入安全和工程团队,形成治理“三角”来防止这种情况,创造相互对立的利益组合,确保云的使用达到管理风险和促进创新的适当平衡。Murray 指出:“基础设施追求稳定,安全团队关注资产保护,而工程团队则寻求快速发展,显著获益于云的快速、灵活性和能力。”


毋庸讳言,任何希望同时实现这些(在某些情况下相冲突的)好处的尝试都需要公司高层的大力支持。Murray 表示:“如果最高管理层没有授权在基层施行激励措施,表明组织的目标是在风险、可靠性和安全方面的限制条件下迁移软件,那么你就不可能真正让上述三个团队团结起来,有效运作。此外,你还需要改变运营模式才能在日常工作实现这一目标。”


实质上,管理层必须确保透明度和协作不仅仅是新的治理口号,而且渗透到企业发展过程中的工作。

 

 

“鉴于云能提供如此广泛的公用设施,谈论云投资的回报率似乎就像试图计算电力投资的回报率。”

 

Ryan Murray,

Thoughtworks数字平台战略总监

 

Shaw 表示:“过去,申请提交后,就会立即移交到负责执行升级事件方法的运营小组,而负责维护该申请的团队直到最后才会参与到这个流程中。企业应该让维护团队更早地参与进来。开发团队必须做出改变,必须具备运营技能,必须了解软件的构建方法,以便掌握生产情况和解决问题。”


企业领导还应该意识到云可以改变运营成本模型。企业常常假定云会通过减少维护(和不断扩展)本地基础设施的相关费用来节省成本。但相比之下,现实情况更加复杂。此外,过度关注成本可能会使企业忽视云带来的更具吸引力的机会。


Chawla 指出,云能降低的往往是诸如软件许可证费用等企业预料之外的成本。而且未必会遵循既定的年度预算周期。成本可能要在项目启动运行后才能完全确定,并且可以(也应该)是不断优化。


他谈道:“成本不是一年出现一次,而是通常有一个试错学习的过程。成本应该直接成为反馈回路的一部分,成为卓越云中心的一部分。”


Murray 表示:“云的主要价值在于加速成本节约,而不是产生成本节约。云需要精心管理,否则许多企业反而将面临成本上升。造成这一结果的原因可能是因为缺乏监督,也可能是因为企业抓住了加速交付的机会,但使用的资源比本地可用资源更多。但是,鉴于云能提供如此广泛的公用设施,谈论云投资的回报率似乎就像试图计算电力投资回报率。”

 

“每当人们问我应该拥有什么基础设施工具或者应该使用什么云功能时,我的问题是:你正在努力实现的目标是什么,你要向用户交付的成果是什么?”

 

Kief Morris,

Thoughtworks 云实践负责人



 

与产品开发一样,在云旅程中,企业最终必须从客户或最终用户价值的角度去审视投资方向或投资额度以及优先考虑哪些项目的问题。


“每当人们问我应该拥有什么基础设施工具或者应该使用什么云功能时,我的问题是:Morris 说:“你正在努力实现的目标是什么,你要向用户交付的成果是什么?如果你不清楚这些问题的答案,你需要停下脚步,弄清楚用户旅程、提供的服务和产品。然后再确定你需要构建什么软件来交付这些东西。”


考虑到云转型所带来的变革程度(特别是对于大型企业而言),在“垂直切片”中进行转型的增量方法可能不那么令人不快,而且还能尽可能避免问题在一切变得无法挽回时才浮现出来的情况。


Morris 解释说:“无论你是想增加新产品或功能,还是改进现有产品,你都应先从客户需求入手,而不是先考虑某项基础设施或某个特定应用。“把所有实现目的所需的人员从各处召集到一起。先处理易于处理的小问题。重要的是要建立反馈环路,先向用户交付一些东西,从而获得用户输入,看这个反馈环路是否起作用以及哪些方面还可以改进。”

 

以切片形式创造价值,支持云策略

Diagram - Deliver value 
in thin slices to support your cloud strategy Diagram - Deliver value 
in thin slices to support your cloud strategy

来源: Thoughtworks

学会以不同方式看待安全

云还需要新的安全实践——尽管这种实践可能不像企业领导者所期望的那样。研究表明,安全漏洞仍然是考虑云转型的企业最关心的问题,这一点在企业考虑向公共云(即第三方供应商通过公共互联网提供的云服务)转型时更为突出。多数是担心可能丢失数据和破坏保密性。


而现实是,主要供应商已经部署了大量资源使公共云服务比典型的企业系统更加安全。Murray 表示:“在保障基础设施安全方面,世界上没有人比主流云供应商做得更好。主流云供应商运营着世界上大部分的互联网基础设施,能够首先看到攻击,他们比任何人都更了解安全和威胁。”


企业需要学会区分基础设施安全和应用安全。基础设施安全的大部分工作外包是给云供应商的,而应用安全则是企业在云端创建和管理软件时需要处理的问题。一直以来,企业安全团队更注重基础设施,可能缺乏在云环境中保证安全所需的软件能力。

公共云中的安全

Diagram – Organizations that have concerns about cloud security Diagram – Organizations that have concerns about cloud security

来源: (ISC)2/Cybersecurity Insiders 

Chawla 指出:“安全部门中如果没有能够建立和执行防护措施的开发团队,或者不知道如何利用 API,就无法保障云安全。”


云需要一种更可迭代和基于风险的方法,这种方法不是通过在流程一开始或结束时引入的一系列约束来保障安全,而是将安全作为一种通过威胁建模研讨会等演练形式整合到开发中的共同责任。


Morris 表示:“安全人员需要加入开发团队,与开发团队合作,了解开发团队认为重要的威胁,为开发团队提供执行响应所需的工具。作为开发人员,我不应该等到准备好发布版本时再来测试这个版本安全与否。如果等到这个时候就已经太晚了,而且修复费用会很高。”


与开发一样,云环境中的安全可能需要团队加强协作,更具有灵活性,甚至需要学习新的技能或重组现有技能。但是,云环境的安全性不应被视为一个问题或者可能减慢企业发展速度的负担。实际上,事实恰恰相反。

“在云原生世界中,你改变得越快,就越安全。”

 

Scott Shaw,

Thoughtworks 澳大利亚公司技术总监

Shaw 表示:“对于旧硬件和大型整体资产,人们假定已有的网站是安全的,任何变更都可能导致漏洞,因此认为通过设置关卡和安全审查来抑制变更是更安全的做法。但是在云原生世界中,你改变得越快,就越安全。其中的假设是:你始终处于脆弱状态,攻击者可能已经获得访问权。通过不断更新和重建托管环境,您可以始终处于安全状态,并能够在发现漏洞时迅速推出补丁。”


Murray 说:“虽然云(供应商)能够更有效地提供可降低部分风险的合理预设服务甚至是高级服务,但从根本上讲,开发人员仍然有可能碰上不知道如何安全使用的新工具。然而,解决问题的办法不应该是拒绝上云,因为本质上,云只会更加安全。”


Murray 补充说:“应对的方法是开展组织教育,调整组织结构和确保更新运营模式,以适应云实现的快速交付以及云提供的工具。你不应把云视为安全风险,云只是个保障安全的机会。”

基于企业实际情况建立供应商和云组合

云空间的快速增长意味着企业有更多的云结构可选择,比如通过专用网络交付的私有云、结合私有、公有和本地基础设施的混合模式、以及在多个供应商和托管环境上部署资源的多云。


Morris 表示,任何组织的最佳云结构选择都应该是基于业务需求的自然结果。Morris 说道:“你首先要做的就是建立云的能力和技能,然后再开始解决更宏观的问题。如果你想从战略层面入手,把一切都运行在某个云上,这通常并不是个好主意,因为你不一定事先就知道最好的答案。”


企业可以基于监管、业务或其他条件决定云结构的选择。某些市场中只有一家可行的云供应商可供选择。多云战略更适合金融等监管严格的行业,因为某些任务关键型应用或数据类型需要实施不同程度的访问控制或安全控制。


选用供应商(或供应商组合)是另一项重要决策。少数大型云供应商占据主导地位,使供应商和客户之间权力更加难以平衡。随着越来越多企业寻求风险对冲,市场上出现了向多云转型的趋势。

全球 IaaS(基础设施即服务)公有云服务市场份额

Diagram - orldwide IaaS Public Cloud Services Market Share, 2017-2018 Diagram - orldwide IaaS Public Cloud Services Market Share, 2017-2018

来源·: Gartner

多云策略还使企业可以通过利用特定供应商的优势或形成更好的价格策略而受益。与此同时,正如许多企业所发现的那样,同时兼顾多个供应商或在多个供应商之间来回选择会令云部署和管理的许多挑战更加复杂。


Chawla 表示,理想情况下,企业与主要云供应商会建立“非常亲密的关系”。“你希望供应商了解和关心你的业务。如果你的方式正确,你将得到再次利用云供应商帮助你构建你想构建的东西的好机会。管理任何云供应商,开始运行系统,让所有员工掌握新的工作方式都是复杂的工作。选择新的供应商并非易事。你必须学习一整套新的概念和流程。”


Murray 对此表示赞同,他说:“与云供应商建立强大的商业和架构关系可以产生很多价值。企业应该始终将云供应商作为战略合作伙伴。大笔消费的大型组织可以成为云供应商的大客户,获得巨大折扣和大量技术支持,甚至影响云供应商的产品路线图。”


Shaw 指出,业务关键性是另一个需要考虑的重要因素。对于起止节点明确且可能不太需要持续维护的项目(比如为特殊活动建立的网站),企业可以全权委托给单个供应商,然后几乎完全不用操心地利用该项目产出的所有收益。但长期的业务关键型资产可能就是另一回事了。

管理多个云供应商的最大挑战

Diagram - Biggest challenge of managing multiple cloud providers Diagram - Biggest challenge of managing multiple cloud providers

来源·: TechRepublic Premium

“如果你想建立一个必须使用 20 年的核心系统,你必须了解你将要建立的关系。你真要孤注一掷吗?还是你希望建立一定的结构来降低不得不将资产转移到另一家供应商的风险?你要现在就花钱建立必要的可移植性,还是日后再花钱重新构建平台?后者几乎从来都无法顺利完成。”


Chawla 表示,应遵循的指导原则是:在业务需要时追求便携性,而不仅仅是为了获取可移植性而追求可移植性。


他表示:“不要只是基于你可能会因对某家云供应商不满而放弃使用这家云供应商这样的想法就把整个电子商务系统一分为二地放到两个不同的平台上。一直有工程领导者告诉我们,他们曾花费数百万美元和数百万小时来打造可移植性,却打算永远不换掉云供应商——现在回头来看,他们认为这种做法是一种浪费。如果你想采用多云,这很好。但你必须有用例,你必须有能力管理多云的复杂性。”

为更多变革和变得更好做准备

Thoughtworks 专家认为,总体而言,企业才刚刚开始了解云的全部潜力。从许多方面来看,这是一个很好的现象。


随着云技术的发展,机会将增多。新冠肺炎疫情过去后,企业几乎必定会面临新剧变,但是云将继续演变和继续支持企业保持领先所需的弹性、速度和业绩的增长。


不断拓展的数据新领域将带来一些更令人兴奋的可能性。其中,边缘计算将有突出表现。边缘计算是一种云向数据源分散和靠近以提高灵活性和速度的趋势。数据源的大规模扩散将对复杂性产生影响,但也将为企业了解终端客户,与终端客户建立联系开辟新的途径。


Shaw 指出:“云的边缘将变得不那么明显。云可能在我们的家里,也可能在我们口袋里。随着数据生成设备产生越来越多的数据,我们需要收集、存储和理解的数据量越来越大,将有更多边缘设备出现。”


云供应商也很难完善基于云的人工智能或者像 Kubernetes 这样能大大简化多个应用开发和管理的容器化系统等更高层次的服务。


Murray 表示:“开发者可以从云供应商那里获取并组装起来的组件将变得越来越明确。并且,随着时间的推移,这些组件也将越来越强大。“你将一直看到供应商开始创建更垂直化的解决方案来用于解决具体的业务问题。”


这将使得企业可按需访问的技术资源和能力大幅增加,同时企业也不需要了解支撑这些服务的编码和架构。


Morris 指出,换句话说,我们更有可能将云打造成为一个多功能、无处不在的自助服务平台。他说:“如果我能以非常标准的方式编写应用程序,封装应用程序,获取配置,和存储数据,那么我就不需要在每次决定制作新的应用程序时都去问别人。我完全知道如何以安全和正确的方式开展这些工作。”


这意味着,即使企业当下受到疫情影响,企业建立云战略的每一步都是在为未来快速进行规模化变革和创新的能力进行投资,这种能力是应对可能永远不会一成不变的环境的终极工具包。对于所有与云相关的挑战而言,不作为的风险更大。


Chawla 表示:“如今,在所有主要行业,所有人都很害怕。如果在你的行业里还有很多企业要上云,而你的公司马上也会成功上云,那么你就超过了其他还未能上云的组织。这是一个巨大的竞争优势,而取得这个优势只需要某个勇敢的高层管理人员作出决策和推动实施。行动起来吧。”

作者 JoJo Swords

订阅《视野》

为数字领导者提供及时的商业和行业洞察。

 

《视野》订阅为您提供我们专家的最佳播客、文章、视频和活动,以扩展我们广受欢迎的《视野》出版物。

Marketo Form ID is invalid !!!