- 2014-07-15 09:29
- 作者:佚名
- 来源:中国数字医疗网
从“微软小冰”及“人机对话”的迅速崛起,到谷歌公司花数亿美金并入人工智能公司,再具体到医院应用的机器人。我们都能看到大数据和人工智能的紧密联系,从人工智能到大数据到底是怎样的一个发展,大数据和人工智能相结合,又将释放出怎样的能量。针对这些问题,北京市信息资源管理中心程军博士在7月11日,由北京市公共卫生信息中心主办、中国数字医疗网承办的“北京卫生信息化大讲堂系列培训”第二期会上作了相关演讲。 |
大数据发展历程
本次培训会的主题是医疗行业的大数据应用,会上,程军以“从人工智能到大数据”为主题作了相关报告。他主要从大数据的发展历程、大数据的关键要素、北京市的建设基础、未来北京市大数据发展方向四方面作了阐述。
程军向参加培训的学员讲解了大数据的概念和关键要素。他指出,从人工智能到大数据,它的发展历程可以简化为四个阶段,第一阶段是1950年提出的人工智能,第二阶段是1960年提出机器学习,第三阶段1995年提出数据挖掘,第四阶段就到了2012年的大数据阶段。
大数据的四大关键要素
大数据是指无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合。在程军看来,大数据共包括四大关键要素:数据量巨大,全球的大数据量在2010年正式进入ZB时代,IDC预计到2020年,全球将总共拥有35ZB的数据量;如今的数据类型早已不是单一的文本形式,而是结构化数据、半结构化数据和非结构化数据并存;如何通过强大的及其算法更迅速地完成数据的价值“提纯”是目前大数据汹涌背景下亟待解决的难题;在海量数据面前,实时获取所需信息,处理数据的效率非常关键。
北京市的基础建设两步走
大数据就像一个烫手的山芋,闻着香,但“吃”起来却很棘手。程军介绍,北京市的建设基础主要包括北京市信息资源的建设情况和基础软硬件的建设情况两方面。目前,北京市一年产生的大数据有126PB,其中绝大多数数据都是非结构化的视频数据,另一类就是秒级响应的物联网实时数据,第三类数据就是日常业务处理中产生的存量数据。程军认为大数据的核心是数据的来源,只有拿到数据,才有可能对其进行分析。
对于数据的管理,北京市对全市信息资源采用了一种目录管理方式,通过信息资源目录来了解全市各个委办局都有什么数据。程军介绍目录主要分三类,一类是基础信息资源目录,一类是主题目录,一类是部门目录,其中基础信息资源目录主要是指自然人,法人自然资源和空间地理以及宏观经济等数据。主题目录中的数据主要包括领导决策、非紧急救助、化共突发事件的应急指挥等跨部门领域的数据。另外一些是部门的资源目录,包括部门的业务目录,部门的数据目录,部门的供养目录和公开目录等一系列目录。目前掌握的目录总计全市有3399项数据。
信息的基础设施主要是信息化基础软硬件方面,对此,北京市有包括有运行环境层,信息资源层,协同平台层,智能应用层,信息门户层和对象服务层以及安全管理和安全保障和信息化管理的一整套相关体系。
程军介绍,目前, 标着颜色的是建成的,还有未标颜色的仍处于建设中。在网络层,北京市统一建设了局域网,政务内网,政务外网,互联网和无线网等。那么在服务器和硬件方面也有全市统一的云计算平台。
在信息资源层呢,北京市统一建设了全市的基础数据库以及部分的主题数据库还有全市统一信息资源目录,在协同平台层呢,北京市统一建设了全市的数据交换,信息的共享以及基准数据的提供和数据比对等这一系列服务功能。
在门户层对内是有公务员门户,和领导决策门户,在对公众服务上面呢,有首都之窗和北京市的网站等这些服务,还有一些通过手机的服务渠道,那么统一的安全体系实际上这个还没有完全建立起来。这个实际上是现在呢是谁建设谁负责,那统一的信息化管理体系现在是逐步建立起来了,这是北京市简单地介绍一下整体的这种基础设施情况。
未来北京市大数据四大发展方向
1人口、法人、空间等基础数据完善
2.跨部门信息交换
3.面向公众、企业的政务信息公开
4. 充分利用社会、企业数据为政府服务
如今,人工智能已经在不断为人类创造商业价值和社会价值,但其本身蕴藏的潜力在大数据的帮助下,还可以实现更深的挖掘与想象空间。