博客首页|TW首页| 同事录|业界社区
2019-03-05

3月3日凌晨,阿里云华北地区出现大规模宕机故障,多家互联网公司都遭到了服务突然中断的影响。事故发生后不久,阿里云官方凌晨回应称,华北2地域可用区C部分ECS服务器等实例出现IOHANG,经紧急排查处理后逐步恢复,此外将根据协议尽快赔偿。

宕机,云服务商无法避免的事情

这些年,随着互联网经济的快速发展,云服务的技术水平、服务模式和使用规模都在持续提升,公有云服务日益被当做与水、电、煤气同等级的基础设施来看待。然而与其他基础设施一样,公有云服务同样会出现故障。以2018年的情况为例,包括亚马逊AWS、微软Azure、谷歌云在内的主流云计算厂商,都出现过规模较大的宕机事件。

2018年3月2日凌晨,因亚马逊AWS的网络服务出现问题,导致依赖AWS服务的部分Alexa开始出现失声问题。该智能音箱的红色指示灯不停闪烁表明服务出现中断,Alexa也一直发出系统内置道歉声。随后几小时内,Alexa又接到了成千上万封投诉。

2018年9月4日上午,微软Azure美国中南区数据中心附近发生雷击在内的恶劣天气,影响冷却系统的电压,导致多个Azure服务出现连接问题,客户难以访问存储在该区数据中心的资源。受影响的服务包括Office365、ActiveDirectory、VisualStudioOnline、VisualStudioTeamServices等。

2018年11月9日,谷歌公有云上提供的Kubernetes服务(GKE)宕机。节点池建置功能出现异常,维运人员无法透过CloudConsoleUI建立新节点。

在国内云服务领域,阿里云,腾讯云在2018年也出现过宕机情况。

2018年6月27日,阿里云出现重大技术故障,恢复时间大概花费一小时。后经过技术复盘,阿里给出的故障原因为工程师团队上线自动化运维新功能时,执行了一项变更验证操作,该操作在测试环境中未发生问题,上线后触发未知bug所致。

2018年7月24日,腾讯云出现宕机情况。用户登录腾讯云时反复出现超时、退出等情况,即便更换运营商,结果也一样。随后,腾讯云发布通知称初步确定是运营商光缆中断,运营商已经找到断点,主要受影响的为广州区域部分用户。

纵观这些宕机事故,其原因可说是五花八门,有软硬件故障造成、也有环境温控失效造成、甚至还有雷击天气的因素。

可见,在当前技术条件下,无论在国内还是国外,云服务厂商出现宕机情况都是难以避免的。

阿里云宕机损害品牌信誉

过去长时间以来,阿里云在国内具有极高的信誉度,凭借这种信誉度阿里云赢得了巨大的市场,截止2018年底,阿里云的市场份额稳居国内第一。

除了稳居国内运服务市场第一外,阿里云这2年还加快了国际化步伐。如今已经在全球19个地区运营了多达52个可用区。阿里云不但已经实现了对美、英、德、日、中等云计算重要市场的覆盖,而且还在新加坡、马来西亚、印度尼西亚、澳大利亚、中东等区域快速拓展服务市场。据研究机构Gartner数据显示,2018年,阿里云在全球市场份额排名已升至第三。

阿里云国内第一,全球第三的”江湖地位”,使得昨天这场宕机事件显得更加引人注目。

事故发生后,阿里云及时做了回应。阿里云回应称”北京时间2019年3月3日凌晨,华北2地域可用区C部分ECS服务器等实例出现IOHANG,经紧急排查处理后逐步恢复。目前我们已经全面排查其他地域及可用区,未发现此类情况。非常抱歉给您带来的影响!如有任何问题,可通过电话工单随时反馈,感谢您的理解和支持!针对本次故障,我们将根据SLA协议,尽快处理赔偿事宜。”。

从阿里云的回应来看,还是比较实诚的。但从目前的情况来看,此次宕机对阿里云品牌信誉还是带来了不小的影响。

有受到影响的阿里云用户纷纷在各种社交网站上吐槽,疑其技术保障体系的缺陷。

玺哥认为,阿里云必须重视用户的质疑和反应,因为对用户来说,把自家的业务和服务放在阿里云平台上,是对阿里云的信任和认可,现在因为阿里云的原因,自己的服务受到了影响,自己服务的客户、收入也受到了影响。

本次宕机事件,一方面让用户开始对阿里云这个品牌本身产生了质疑,另一方面,也迫使更多企业认真思考“多云战略”。

“多云战略”受关注,腾讯云们的机会来了

本次宕机事件后,如何预防服务中断、避免关键数据丢失成为大家关注的重点,同时, “多云战略”成了大家的焦点议题。

将关键计算能力、核心数据尽量分布在多个品牌的云上,这是避免损失的有效做法。这其实是“老生常谈”,技术人员都知道,但过去多数企业的管理层都没有对此真正重视起来。而近年来各种”宕机”事故的频繁发生,也给企业敲响了警钟,“多云战略”已成为企业在IT基础建设方面的共识。

所谓多云战略,指的是企业同时采用两家或以上的云服务供应商,并且在多个云之间部署热切换系统。这样当任何一家云服务商出现运行故障时,企业的关键应用和核心数据,就能迅速切换到其他云服务商的设施上继续运行。

实际上,多云战略在欧美先进地区早已广泛为企业接受。据IDC的预测数据,到2020年9成以上的企业都会采用“多云”来构建基础IT能力。随着国内企业纷纷跟上这个技术潮流,期望同时采用多个云服务品牌,为关键应用提供安全性。腾讯、电信等云服务商必将得到更多发展机会。

同时,欧美国家企业界的经验表明,由于企业普遍期望降低自身在IT方面的成本、同时又希望提升IT系统效率,所以他们在选择云服务商时,往往倾向于采用行业内排名靠前的品牌。在多云战略中,企业也会同时采用两家排名前列的品牌来支撑自身的IT系统。在欧美,亚马逊AWS、微软Azuer云等,都是各企业多云战略中的常规选项,当前IT系统的高度复杂性、升级迭代的密集度,也只有这些顶级服务商才能胜任。

同理,在国内云服务领域里,目前市场份额排名靠前的阿里云、腾讯云、电信云等,必将成为多数企业“多云战略”中服务商品牌的主要选择。

玺哥认为,正在使用阿里云的许多大企业、甚至中小企业,在考虑部署多云战略时,或将腾讯云列入优先考虑名单。换句话说,本次宕机事件后,在企业界兴起的“多云战略”技术潮流中,腾讯云极有可能成为最大的受益者。

腾讯云们的机会来了,但能否追赶上阿里云的脚步,就要看腾讯云能否抓住这个机会了。

2018-12-25

12月15日,由腾讯云主办的“腾讯云+社区开发者大会”在北京举行。本次大会汇聚了超40位技术专家,吸引了超过1000名开发者 的参与。

今年国庆前夕腾讯在重大组织架构调整中,把产业互联网确立为企业的战略发展方向,为此提出要把公司从过去的To C模式转换到 To B模式上来。玺哥认为,本次“腾讯云+社区开发者大会”,是一次腾讯对外输出ToB关键信息的大会,也是腾讯在产业互联网上的重要战略部署。

腾讯向开发者传达ToB关键信息

腾讯云副总裁王龙在这次腾讯云+社区开发者大会上表示,为了助力产业数字化升级,腾讯将在小程序、物联网、人工智能和云原 生这四个领域里,通过整合自身技术和生态资源,打造丰富多元的开发者生态,为他们构筑全链路的服务体系。这套体系,也可以看作是腾讯产业互联网的开发创新机制。

据悉,为了让开发者在小程序领域里更加得心应手,这次大会上腾讯公布了由腾讯云和微信团队联合推出的小程序•云开发。在这 套体系下,开发者将不再像以往那样受困于后端的基础设施,在小程序开发完毕进入应用后,也不需要对后端的维护有太多顾虑。 小程序•云开发体系将“无服务serverless开发原则”贯彻得相当彻底。在典型的小程序文件上传功能的开发上,以前传统开发模 式需要1142分钟,而转入小程序•云后,一个前端、4分钟即可完成所有开发工作,效率大大提高,开发者们对此感到振奋不已。

在物联网端,腾讯推出了“一云两端”模式。依托腾讯云强大的云计算能力,将应用端、设备端无缝连接起来。在这个模式下,腾 讯将与物联网相关的产业链上下游、软硬件合作伙伴整合进了一个生态闭环中,终端设备、云平台、应用程序等全链路都得到了打 通。

针对开发者,腾讯推出了集AI开放平台和人工智能服务平台•云智天枢为一体的AI开发者体系。该平台可为开发者提供全栈式的人 工智能开发服务,以为开发者提供更高效率、更低成本的AI创新应用。

此外,腾讯还推出了整合CODING研发能力和腾讯云强大云计算能力的腾讯云开发者平台。该平台可以为开发者提供运维开发全套流 程体系,让用户随时随地开发、协作与部署,降低开发成本和IT 复杂性,以助推企业快速创新。

人工智能、物联网、小程序、云原生,以上是腾讯整合自身技术和生态资源后向开发者构筑全链路的服务体系。在玺哥看来,这就 是腾讯向开发者输出的关键ToB信息。

通过输出以上信息,腾讯告诉开发者,这就是目前腾讯在ToB端的政策机制,这也是腾讯拥有的资源和主要发展的场景方向,你们在这 些场景上去做开发,去创新,就能得到腾讯的帮助和支持。

腾讯在产业互联网的重要战略部署

本次腾讯云+社区开发者大会,腾讯不仅通过官宣方式向开发者传达了ToB的关键信息,还通过论坛讨论的方式明确了腾讯在产业互 联网方向上的部署。

大会邀请了58集团CTO邢宏宇、蘑菇街高级副总裁顶天等专家组建大会联席主席团。并在四大分论坛集中探讨了大数据+AI、DevOps 、物联网、微信小程序领域的最新趋势与实践应用。在分论坛讨论中,向开发者展示了智慧酒店、智慧园区、智慧出行、智慧工业 等场景解决方案。

不管是专家探讨的方向还是腾讯展示的场景解决方案,实际上都是在引导和启发开发者在场景方向上向产业互联网创新发力。

通过这次大会,开发者不但了解了腾讯在整合自身技术生态资源后的所构建的新全链路的服务体系,还了解了腾讯在产业互联网上的重点发力方向。对腾讯来说,这些开发者将是腾讯在产业互联网时代价值和技术输入的重要创新者和传播者。因为有开发者的创 新何传播,腾讯的全链路的服务体系才能持续的夯实腾讯的产业互联网基石。

当然,如何激发开发者的创新热情,帮助开发者真正在产业互联网时代实现自己的价值,这是腾讯能否成功转型产业互联网的关键 。

激活腾讯产业互联网创造力

如上所言,如何激发开发者的创新热情是腾讯能否成功转型产业互联网的关键。

腾讯产业互联网能否转型成功,很大程度上也取决于开发者的创新。在这方面,腾讯通过本次开发者大会致力于向开发者们展示两 点:1、在腾讯体系下,开发工作将变得空前便捷而快速。2、腾讯提供的开发者体系是一个全链路服务体系,提供的是整套方案而 不是只能完成某个环节工作的工具。这个全链路服务体系,也是腾讯产业互联网战略与广大开发者之间实现连接的纽带。

但只有解决方案,服务体系是远远不够的,单靠到会的1000名开发者也是不够的。腾讯产业互联网需要更多的开发者参与进来,一 起创新,共同创造。

为了让更多的开发者参与到腾讯产业互联网的建设中来,腾讯在本次开发者大会上还发布了TPV(腾讯最具价值专家计划)。其目 标是建立起一个开发者与行业内顶级专家可以进行频繁交流的平台,让腾讯云、开发者、用户、技术专家之间能够形成良性互动, 共同打造健康的、可持续发展的云计算技术生态。这些互动和交流,无疑将帮助腾讯云用户充分发挥创造力,并在他们中涌现出更 多具有引领行业格局能力的创新者。

据悉,TPV计划目前已经得到近60位行业顶级专家的大力支持和参与,在他们的帮助下,腾讯云用户将在技术进步的方向上取得更 快的进展。

TPV的价值在于,这些最具价值专家都是在业内具有较高影响力的行业意见领袖,有他们的“背书”,腾讯产业互联网的关键信息 传播就更有说服力,也更容易被业界人士接受。他们的传播,也将让更多人知道腾讯在产业互联网上的部署和决心。也会吸引更多 更强的开发者,企业加入到产业互联网的建设中来。

实际上,早在一个月前腾讯云就已经在腾讯全球合作伙伴大会上,公布了整合上下游产业、构建AI新生态的“三连跳”策略。本次 大会上推出的TPV计划,让用户们更加确信腾讯携手伙伴、助力各行业拥抱产业互联网时代的信心和决心。

2018-10-08

国庆节前夕,腾讯公布了十年来最引人瞩目的架构调整,在原有的5个事业群基础上又新增了两个:平台与内容事业群(PCG)、云与智慧产业事业群(CSIG)。

架构调整,腾讯To B步伐又前进了一大步

这次调整可以说是众望所归,PCG的组建被广泛认为是腾讯对内容产品领域里,长期执行的“赛马”机制所进行的一次总结和提升。而新增的CSIG为各行各业提供定制的数字化助手,从而实现将消费者与产业对接,创造更大的产业价值。新的架构调整,标志着腾讯在迈向To B的道路上又前进了一大步 ,也是腾讯连接战略的升级。

在未来的腾讯架构里,PCG将是聚合包括QQ、微信等流量平台、培育优质内容创作的大生态。既拥有内容分发渠道、又具备内容创作能力的PCG,正在实践“社交+内容”融合创新,在发展方向上隐约已经有了成为“数字迪士尼”的趋势。玺哥认为,PCG将肩负着为腾讯在C端筑起更高竞争壁垒的重任。而这一切的技术基础,则来自于马化腾一直极为重视的“云计算”。云与智慧产业事业群(CSIG),作为强大的底层基础设施,会为内容生态创新提供驱动力。与此同时,CSIG将更好地实现C端用户与新产业端的连接,为腾讯向To B方向的转变提供强大的“****”。

多年的发展,让腾讯积累了两项让竞争对手望尘莫及的优势:1.以社交为核心的10亿级别用户群。2.千亿市值的生态合作伙伴。腾讯未来的连接战略显然将依托这两大优势,以消费者为中心画立体圆。

在这个立体圆的结构中PCG作为横轴,其战略目标是扩大C端的想象力。我们仔细观察会发现,新架构下的PCG汇聚了QQ、Qzone以及多个流量入口和内容平台,以此为基础内容生态将会得到更好的发展条件。在腾讯音视频多媒体底层技术以及人脸识别、机器写作等AI技术的最新发展驱动之下,PCG的聚合效应将大大激发内容的传播效力,成为内容传播的“倍增器”。同时也极大丰富和提升平台的用户价值,牢牢吸引住用户令平台成为“磁铁”。这种倍增+磁吸的双向赋能效能必将爆发出巨大的力量。

“社交+内容”生态更加丰富和有生命力后,腾讯本已拥有的C端用户群将更加稳固,也就为下一步向To B方向的转变提供了理想的条件。而要实现这个战略目标,腾讯以消费者所画的那个立体圆,还需要一个将C端用户与新产业端相联系的纵轴,新成立的CSIG正是承担着这个重任。To B业务涉及到民生、政务、安全等领域,都需要一座强大的****,将庞大C端用户与这些领域连通起来。腾讯总裁刘炽平反复强调,互联网下半场竞争的胜负关键就是把消费者和产业对接起来。新的CSIG将整合智慧零售、教育、医疗、安全、LBS等各行业的解决方案,以腾讯云为技术基础构筑从C端到To B的坚实桥梁。

综合而言,今后腾讯PCG在C端筑起的竞争壁垒有多高,以CSIG腾讯云向新产业端的连接就有多强的想象力。

在这个背景下,玺哥认为腾讯云的发展前景非常乐观。它必然会在腾讯今后的发展战略中占据关键位置。8月刚发布的财报显示,腾讯云服务收入增长高达200%,也从侧面印证了这一点。

向“社交+内容”转型,建立C端竞争壁垒

腾讯董事会主席兼CEO马化腾指出,企业不能只专注眼前的业务,而是要立足于长远发展。腾讯成立以来已经做过三次具有战略意义的架构升级。第一次是2005年升级为事业部制(BU),其后在2012年又实现了面向移动互联网的事业群制(BG)升级。刚刚公布的架构调整则为第三次,其宗旨就是把企业从2C的消费互联网结构,转变为面向To B的产业互联网模式。

作为一个多年来深耕2C端的企业,腾讯已经凭借社交积累了无与伦比的流量优势。与其长期2C基因相对应的,是腾讯采用的所谓“赛马”机制,允许并各个部门在激烈的内部竞争中不断创新。赛马机制为腾讯催生了微信和王者荣耀这样的顶尖产品,是腾讯取得成功的重要动因。

但马化腾也指出,互联网的下半场必然是“产业互联网”的赛道,腾讯必须实现向B端的升级。为了达到这个目标,腾讯在业务方向上选择了以“社交+内容”为战略重点。目前腾讯已经拥有了新闻、视频、体育、短视频和影业动漫等优质的内容基础,加上微信、QQ、应用宝和浏览器等国内最大的流量入口,腾讯完全可以产出优质内容同时,又便利快捷地为内容提供有效的用户触达。这就是业界普遍憧憬的“数字迪士尼”模式了。

为了适应这个新模式的运行,腾讯需要做组织架构上的调整。过去颇有各自为战感觉的内容产品之间,由于技术架构存在差异,会对后台的内容组织和提供带来障碍并推升业务成本。新的平台与内容事业群(PCG)的建立,将结束长期以来的“赛马”模式,顺应2B业务的要求而将整个内容创作整合到统一的大方向。

在新的PCG架构里,以往依托于社交网络场景立足的内容产品,将不再会因为新旧场景转变而遭遇冲击,而是通过顶层规划的组织架构形成内容矩阵,让用户可以在不同的社交场景中自如转换、完全不用担心不同的场景会影响体验。例如在视频方面,PCG今后完全可以将原有的以场视频为主打的腾讯视频、以短视频为主打的下饭短视频,以及影视剧解析欣赏方面的速看视频结合起来,与社交短视频领域的微视、闪咖、DOV等形成囊括浏览、社交等的整条内容生产线。

腾讯在内容方面已经拥有令业界称羡的产品线,今后改变“赛马”机制、打破部门间障碍,实现“社交+内容”转型后,信息流与包括视频在内的内容的协同合作将更趋合理,其发展潜力是头条、阿里大文娱等竞争对手难以企及的 。PCG在C端的发力,毫无疑问将带来更强的用户粘性,在CSIG的助力之下也必将实现与B端和G端应用的连接。这一点我们从蘑菇街和摩拜的例子中就可窥见一二:在蘑菇街的应用场景中,CSIG的腾讯云为平台搭建“互动+直播”模式,实现庞大用户群与电商行业的连接。而摩拜单车同样依托CSIG的腾讯云提供了包括解锁、定位、计费等的实时数据传输在内的云端+车载模块服务,确保了用户的使用体验感。以To C业务巩固和强化用户基础、数据和资源,同时依托CSIG连接B端。这就是腾讯内容+社交转型的逻辑。

打造腾讯技术中台,强化资源协同

腾讯此时进行架构调整,也是在内部竞争模式和技术两方面对多年来的发展进行的一次总结和反思。ToC端业务长期实行的赛马机制,虽然出了不少“好马”,但在人力资源上造成人员在不同的部门和事业群过于分散,力量不集中也导致了整体竞争力被削弱。以AI领域为例,一直以来都被内部抱怨为赛马机制最大的“受害者”—-AI人才的成本向来高昂,分散配置、各自为政的打法直接影响影响营收和利润。赛马机制更严重的后果是,各个部门之间长期难以实现资源优化配置,以至于大家“重复造车轮”。

技术上,腾讯也也有多年的积累。以腾讯云为例,腾讯云计算在存储与CDN、数据库、安全、私有网络、高性能数据库、专线接入等方面均有积累,有的更是处于行业领先水平。在游戏、视频直播等领域里,腾讯云以先进的技术帮助众多对性能要求极高的大型游戏,实现了云端稳定运营,众多领先游戏公司都已经转向腾讯云寻求高性能以及稳定的网络传输质量。在高度重视之下,腾讯云已经进入高速发展阶段。虽然其服务直到2013年才向行业开放,总体规模上仍然不及阿里云。但是腾讯云已经连续多个季度实现远超阿里云的收入增速,2018年三季度更是以200%的增长率远远抛离对手。

现在的腾讯云,在技术上强调稳定、安全、高速和服务的4S,在能力上以“数智分布式计算平台”在大数据处理方面领先全球,安全欣赏更是获得了信息安全UKAS国际认可,病与Radware形成了战略合作关系。并且还以直播云、金融云等垂直行业云实现精细化服务。可以预计,腾讯将会对云与智慧产业事业群(CSIG)进一步给予资源倾斜,进一步夯实云服务这个基础的技术能力。

虽然腾讯在技术上有着深厚的积累,但由于过去公司缺乏一个统一的技术中台,使得各技术人员之间的协同出现了一些问题。例如,在社交领域,腾讯虽然拥有最丰富的数据,但缺乏中台的结构却令企业不同业务之间出现数据障碍,难以沟通以实现统一的开发流程。

腾讯最大的竞争对手阿里巴巴,早在2015年就由马云亲自部署打造“小前台,大中台”的技术架构,全面整合企业的技术和数据能力。以网购需要用到的“刷脸”技术为例,阿里的做法是由技术中台将其做成一个底层接口,任何业务部门和团队都可以直接调用,在不需要独自开发“重复造轮”,既促进新业务开发又节省成本。相比较之下,腾讯在技术中台建设上缺课不少。公司从上到下都深刻感受到了压力:想要实现ToB端转型,腾讯自己的技术中台必须今早建立起来。

腾讯前CTO张志东就一直主张企业要花大力气建设统一的技术中台。拆除内部繁复的“数据墙”,让腾讯及时补上长期缺失的这一课,是张志东一直到离开CTO位置那天都没能实现的愿望。如今新的架构调整终于对这个问题提出了回应:官方表示将成立技术委员会,在内部采用分布式开源协同以强化基础研发,打造腾讯特色的技术中台。

而打造中台这个任务,在本次架构调整中就落到了云与智慧产业事业群(CSIG)的肩上。

云是源动力,玺哥看好腾讯云与智慧产业事业群(CSIG)

在未来的腾讯架构下,所有与内容、社交相关的人工智能AI、大数据技术等设施和服务,将全部整合为一套ABC(AI、Big Data、CloudComputing)服务体系,实现后台技术、数据、IP等的统一调度,建立起腾讯特色的技术中台。可以这么说,CSIG的发展将直接决定着腾讯To B业务升级的成败。

早在2016年的乌镇互联网大会上,马化腾就反复强调过以云计算为基础的“生态系统基础服务”。其后的两年时间里,腾讯在多个场合都表示云计算将成为腾讯未来发展的战略基础。关于这一点,业界都关注到马化腾有一句非常到位的总结:“马化腾有一句话很有名:“未来传统行业利用互联网技术的核心,就是在云端利用人工智能的方式去处理大数据”。

事实上,重视云服务也已经是互联网经济界的共识。像Facebook、谷歌、亚马逊等国际巨头在实现从C端到B端的转型过程中,都认识到云计算的极端重要性。在国内,阿里方面更是在云服务建设上不遗余力,蚂蚁金服和阿里云的迅速发展引人瞩目。深度融合人工智能、大数据与云计算,形成云服务竞争优势,已经成为互联网经济圈的集体判断。在这个背景下,马化腾提出的“云是产业革新的源动力、云是新型社会管理的主平台、云是人工智能的强载体”论断就更加深入人心了。在2017年6月的“云+未来”演讲中,马化腾甚至将云服务与水电等基础设施相提并论,可见腾讯对此的重视。

全力实现向To B业务的转型,是腾讯这次架构调整的根本目标。以“社交+内容”作为将消费者与产业连接的抓手,是腾讯的方向。而腾讯云服务则将成为这一切的技术基础,在调整架构搭建好团队后,今后将通过CSIG将B端业务和云端业务力量整合。

腾讯云,就是腾讯的源动力。