您所在的位置:首页 > i医疗 > 行业动态 >  亚马逊云科技开启数据之旅,四站直达洞察!
亚马逊云科技开启数据之旅,四站直达洞察!
——2021亚马逊云科技re:Invent全球大会媒体沟通会摘要
  • 2021-12-21 11:55
  • 作者:尹聪颖
  • 来源:HC3i数字医疗网

历史的车轮滚滚向前,IT也是如此。

今天的IT有多庞大?

亚马逊云科技已经提供了超过475种不同的计算实例类型。Amazon S3现在存储了超过100万亿个对象,Amazon EC2每天启用超过6000万个新实例。

纳斯达克系统平时每秒处理300万条信息。在高峰期12小时内有600亿条信息进入交易系统,以及超过1200亿条信息导出系统。

IT蓬勃发展的结果就是——接下来的数据增速会更加迅猛,从现在到2024年的三年中创建的数据量将会超过过去30年创建的所有数据量。

亚马逊全球副总裁、亚马逊云科技大中华区执行董事张文翊

数据到底有什么用?

数据应用不是现代人的专利,早期数据应用的一个代表人物是提灯女神——南丁格尔。

19世纪50年代克里米亚战争期间,南丁格尔通过查阅大量数据和档案,发现英军死亡的主要原因是战场外感染疾病或者是伤者护理不当最后伤重致死,真正死在战场上的人反而不多。她做了大量的数据收集工作,然后做了一个饼图:蓝色代表了疾病导致的死亡,红色是受伤以后没有得到适当的护理导致的死亡,而黑色是其他原因造成的死亡。通过分析她得到一个震惊的发现:医院里病死的士兵是战争中战死士兵数量的十倍。基于这样一个数据分析和洞察,她能够成功地说服军队的高层快速行动起来,去批准了新的战场护理伤员的卫生标准,同时运送了更多的物资,保证了医院的空气和水的清洁。六个月后,英军死亡率下降了90%以上。

每个企业或机构中,无论是领导还是员工都可以借助这样一个数据驱动业务的思维模式,彻底改变解决问题的方式。因此,各行各业数据采集和分析的应用探索频频落地,来自数据的挑战也在悄然出现。

踏上数据的旅程!

数据天生是流动的,数据一定在各个不同的存储之间在移动。

数据的流动像一场数据的旅行,尽管每个企业或机构的数据之旅是独一无二的,但是在这个旅程当中有几个大的数据停靠点基本都是一致的。

l 数据旅程的第一站:应用程序数据库。应用程序的数据会流向数据库来做存储和处理。

l 数据旅程的第二站:数据湖。从各种来源的无论是结构化、半结构化、非结构化的数据,通过数据湖去实现整合和管理。

l 数据旅程的第三站:分析引擎。当数据整合之后,就可以通过各种专门构建的分析工具把它真正从数据变成知识以及变成洞察。

l 数据旅程的第四站:机器学习。越来越多的用户会把机器学习和人工智能加入到他数据旅程里边不可或缺的一部分。

要想让数据为人服务,必须有人做好数据治理的工作,即:把正确的数据交给正确的人。数据管理者需要完全掌控数据存储的位置、明确谁有权访问以及谁可以使用这个数据做什么。

亚马逊云科技:护航你的数据之旅

亚马逊云科技大中华区产品部总经理 顾凡

亚马逊云科技的目标就是希望客户在整个数据旅程中不会在性能、成本、获得见解的能力和创新速度方面做妥协,所以亚马逊云科技设计服务和产品的一个宗旨就是:

——专注在数据旅程的每一步去构建最适合你的工具,提供给你最适合你的和正确的能力,保驾护航你的整个数据之旅。

亚马逊云科技数据旅程的第一站:数据库

挑战:传统关系型数据库打天下的时代已经过去了。因为有太多的现代化的应用,无论是像视频、社交、出行类的这些App,应付的数据级别都是PB甚至EB级,并发甚至上亿,这些都不是传统数据库能够搞定的。

方案:专库专用,所以如果想用托管的关系型数据库,你可以选择Amazon RDS,它可以兼容Oracle、SQL、MySQL、PostgreSQL所有这些引擎。如果想用MySQL和Postgre这样开源的数据库引擎但是又担心性能和高可用达不到商用数据库的级别,那就选云原生的Amazon Aurora。如果客户想要一个托管的键值数据库,而这个键值数据库针对的是海量数据场景,要能够提供毫秒级的响应,就选Amazon DynamoDB。如果需要托管的MongoDB,就选Amazon DocumentDB。如果需要一个内存数据库提供一个极致的低延迟,那就去用Amazon Elasticache或者Amazon DocumentDB。如果想要一个托管的图数据库,可以选用Amazon Neptune。

亚马逊云科技数据旅程的第二站:数据湖

挑战:企业有来自不同数据库、数据仓库的多种数据源的结构化、半结构化、非结构化的数据源源不断地涌入各种数据湖,数据湖的管理员可以针对不同的用户、不同部门的业务,在表和列一级上对访问权限进行精准的控制吗?

方案:Amazon Lake Formation出了一个新的功能——Lake Formation行与单元级别安全的功能,该功能就能够支持在行一级以及行和列交叠的单元级别去做数据访问的权限精准控制。Lake Formation这样一个新功可以基于管理员设定的规则去自动地过滤数据,向一组用户去显示经过你过滤后的数据。

亚马逊云科技数据旅程的第三站:分析引擎

挑战:现在你已经准备好分析你的数据了,你希望所有的时间都集中在应用上。

方案:亚马逊云科技的目标是给客户提供全栈的无服务器产品。2018年推出了Serverless的第一个关系型数据库Amazon Aurora,把关系型数据库做成无服务器化是非常有难度的。2020年推出了Amazon Aurora Serverless V2,真正可以在几分之一秒,就把一个数据库的交易数量一下从数百个事务扩展到数万个。亚马逊云科技在今年re:Invent新发布了4个无服务器分析服务,分别是Amazon Redshift,Amazon Elastic MapReduce, Amazon MSK和Amazon Kinesis stream。全栈的无服务器服务的提供一定是未来的趋势,未来一定会有越来越多的用户希望端到端地用服务器构建一个更复杂的业务应用。

亚马逊云科技数据旅程的第四站:机器学习

挑战:疫情给航班和旅客带来很多不确定性,对于旅客来说最头疼的:总得知道那个国家的核酸检测、疫苗接种需求和需要准备的文档,以及文档是否在你登机前可以被验证。一旦人多了,如何处理这么大规模的需求?

方案:美联航推出了旅行就绪中心一站式平台叫做Travel-Reday Center,它可以做到什么呢?可以帮客户轻松了解目的地所需的核酸检测、疫苗接种需求,同时当客户大规模上传检测结果、疫苗接种记录,包括给各国填写的各种复杂的表格。借助亚马逊的数据分析和亚马逊的机器学习技术,用机器学习的方式推理和鉴别。现在75%的核酸检测文档和表格都可以机器自动审核,极大提高了运营效率。作为旅客的体验也很好,这就是美联航如何利用机器学习提升客户体验的一个案例。

亚马逊云科技的工具箱里,底层是广泛的机器学习框架和算力,它面向的是机器学习的专业从业者;中层是Amazon SageMaker这样一个全托管的机器学习集成开发环境,它面向的是最广大的机器学习构建者,也是面向最多的人;工具箱最上层提供的是开箱即用人工智能服务,它面向的是应用开发者。

在亚马逊云科技的支持下,企业或机构的数据可以在数据库、数据湖、分析引擎和机器学习工具之间自由流动,充分融合,产生更好的价值,得到更好的洞察。

降低门槛 数据为王

亚马逊云科技始终在强调数据是有旅程的,所以一直在致力于把数据库、数据湖、数据分析、人工智能和机器学习更紧密地集成起来,降低门槛,为客户的整个数据旅程提供全栈式服务。只有这样,才能让更多人不害怕技术的复杂度,从而真正利用技术来洞察和指导行动。

转载请注明出处:HC3i数字医疗
【责任编辑:经纬 TEL:(010)68476606】

标签:亚马逊云科技  数据  
  • 分享到: