- 2013-12-26 20:41
- 作者:徐向东
- 来源:中国数字医疗网
近年来,人们对医疗行业数据利用的探讨不绝于耳,卫生信息化建设也迎来了自己的“大数据时代”。如何利用大数据来改善医疗质量?卫计委统计信息中心徐向东以其敏锐独特的眼光透视大数据,阐述了医疗卫生跨入“大数据”时代的特点、如何构建大数据的生态环境以及大数据时代催生“科学思维方法”的巨大转变。
一、大数据的特点
纷繁复杂的医疗结构数据在近年来所呈现的爆发式增长的势头引起了业内许多人的担忧。于是,大数据一词被搬到众人的面前。
维基百科对大数据的定义:“大数据是指无法在容许的时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。”
其实数据一直都在,只是最初未发现它而已。就像有了显微镜,能看到微观的世界一样,其实微生物一直存在,只不过原来没有显微镜。同样,看到了星球是因为有了天文望远镜。有了这些工具以后就能发现一个以前不知道的世界,同样大数据也是。通过这种分布式数据的处理,以及大数据、非关系性数据库的工具的出现,导致我们对大数据的认识和利用、挖掘才提到了议事日程。”
大数据的三个研究维度:理论+技术+实践
现在国内对大数据的研究分成三个维度,第一维度是理论方面,包括它的过去、现在、未来发展,以及隐私等;第二维度在技术方面,像感知类技术、存储技术、分布式处理平台、云计算等;第三个维度在实践层面,这部分与我们结合非常紧密,个人拥有的大数据,对医疗卫生行业就是健康的数据。
像吸烟的数据、步行每天走多少步的数据、血压脉搏的数据可能都是自己大概知道,但不会形成巨大量的数据,能产生商业价值,也是被我们所忽略的。还有企业自己产生的大数据,包括医院内部的HIS、LIS、PACS以及区域卫生的电子健康档案和医院的电子病历所产生的这些数据是在内部的。一方面,这部分可挖掘的东西更多,因为它关联度更高,它就是政府内部的数据。也就是通过每年的一些统计报告、统计年报等方式来示人,没有提供给大众查询,另一方面,占据更大的份量,这部分其实一直在颠覆传统的一些行业,就是互联网数据,目前来说从它的发掘和应用,包括对于大数据举的好多例子都是基于互联网的例子。特别典型的谷歌预测流感大爆发的例子就是大数据在互联网的具体应用。目前,中国正处于大数据产业快速增长期,2011年国内市场投入近3.2亿,2016年整体市场将突破百亿量级,未来中国将形成全球最大的大数据产业带。但是中国发展大数据产业仍处于起步阶段,整体发展要基于现实的发展水平和自己的国情。在信息化时代通过数据产生的量级能看到社会的发展和发达程度。在中国量级250PB,北美3500PB,如果以人口作比较,相对于北美,中国的数据量还很小,而发达国家的数据产生量其实是非常大的。以日本为例,日本这么小一个国家,人口、国土面积上跟中国不是一个重量级,然而数据量产生却远远超出中国。
二、构建大数据和谐生态环境
用共建共享创造美好的生态环境,从而让大数据发挥其更大的作用,是一个不争的事实。
我们需要的不是丛林式的你死我活的厮杀环境,而是需要有阳光、树林、水分,微生物等一个和谐的生态环境,才能促进大数据的生态环境让它发展。大数据的几个环境是这样的,包括生存、发展、盈利、增长等因素加起来就是大数据的生态环境。对于数据应用层的决策分析、社区健康、健康管理、数字医疗、移动医疗的应用也开始慢慢成熟起来。良好的生存土壤和阳光,以及给予它的关照都慢慢形成了大数据的生态。
大数据的生成类型
大数据的产生从生成类型来说有交易数据、交互数据、传感数据。医院现在用的更多是交易数据,从以财务为中心的信息化到现在临床为中心的信息化,交易数据也开始慢慢转向交互性数据。还有一部分是传感性数据,包括心电图、手术麻醉机给我们传回的数据,其实这些都丢失了,没有跟真正的病情联系起来,而这块联系起来才是大数据深化应用的一个阶段。
大数据促进了分析和思维模式的变革
信息化不能仅仅只是初级应用,而是要实现高级运用。目前,在大数据时代背景下,我们对各种医疗数据采集之后,如何对这些庞大的数据进行挖掘,进行分析非常关键。
大数据促进了分析和思维模式的变革,这是真正大数据贡献给这个时代的对象。大数据贡献了技术和思维模式,不是随机样本,而是所有的数据。随机样本是什么?在小数据时代,就能搜集一点数,所以特别要求数据的精确性,因为要根据它来推断因果关系完全是有实证性的。到大数据时代,其实是庞大的数据为决策或者分析来提供决策分析的,不是强调数据的精确性,而更强调混杂性。多结构非机构化数据、迭代增长数据的处理利用,这才是真正大数据贡献给的,对于原来的统计和分析整个是颠覆的思维方式。
同时,大数据将成为重要的生产要素和决策依据。到大数据时代,海量的数据蜂拥而至时,很少有明晰的头脑或手段从这里头抽出一小段东西,而是更强调相关性。在美国,大数据医疗的发展早已走在了前端。以前医生看早产儿发病是靠经验,往往不能及时解决病症。美国根据放在新生早产儿的16个部位,包括血压、脉搏、体温、呼吸、血氧饱和度等来采集数据,通过相关性的分析,提前预判孩子今天可能要发烧,这个应用做的特别好。这就是一个大数据时代,把医疗的基础生命体征融合起来,通过相关性分析,提前预判的实例。大数据提供给我们一个分析方式和思维方式是预判,预测一件事情的发生。
大数据的成长
不是大数据创造了价值,而是大数据思维触发了新的价值增长。它在创造了一种思维方式的发生和一种业务模式的创新,导致这种大数据才有它真正应用的意义。这是大数据成长的根本所在。云计算改变了IT,大数据改变了业务。云计算是技术层,是一个进阶的IT解决方案;大数据是业务层的产品,是业务和决策的新基础资源,可能更受CIO关注。
大数据促生“数据科学家”
医院信息中心是整个医院或者卫生厅局的神经中枢,是数据中心,所有数据都汇集在此,在大数据时代,慢慢会催生一种新的职业,通过数据挖掘一些新的业务创新和管理的创新,找到新的增长点,国际上流行说法叫数据科学家。这类人拥有几个特质,第一个就是技术专长,对一些科学学科有深厚的专业基础知识;另外就是有好奇心,特别愿意钻研,直至发现数据的内在规律;再次,比较关键的素质和因素是沟通能力,尤其对于信息掌握越多,需要与更多人打交道时,良好的沟通能力和挖掘能力才能将工作推行下去。最后,在不同问题上有创造性和掌握工具方式尤为重要。
三、大数据与卫生信息化
大数据时代来了,卫生信息化会是什么样?大数据背景下的卫生信息化建设该如何实现华丽转身?
卫生保健是大数据最具应用潜力的行业之一
美国一研究报告对大数据具有应用潜力的行业做了排名,其中包含政府、卫生保健和社会保障两个层面。政府对于正在如火如荼地推进电子病历区域卫生信息化这块,卫生厅局是一个借鉴。十八届三中全会对于社会资本介入到医疗行业和健康保健业,已经开始有这种政策的导向。对卫生保健和社会保障,像深圳开始做医生的自由职业,慢慢可能引发医生自由人或者社会人在不同医疗机构执业发生医疗行为的过程。我们猜想会慢慢出现这种状况——政府行业和卫生保健综合潜力靠前,但是在政府行业业内表现差异度表现最低,几乎千公司一面。而对于医疗保障和社会保障相对好一些。
此外,医院数据的交易密度其实非常低,医院做信息系统最多跟医保发生交互,剩下都是医院内部的数据,不管是HIS、LIS、PACS、RIS还是固定资产,都是在医院内部的小循环完成的,除了为医保上传治疗信息、用药信息,几乎没有对外数据上传。这样看来,卫生保健业的潜力非常大,对大数据而言,前途是光明的,道路也是曲折的。
医疗大数据主要来源
国际上公认的医疗大数据的主要来源由四方面构成:1、制药企业/生命科学;2、临床医疗/实验室数据;3、费用报销/利用率;4、健康管理/社交网络。我国现代医院的主要来源于所有的系统,结构性的数据库较多,大量在医患交流时口述的数据以及心电监护仪等搜集数据往往都丢掉,造成大量数据流失。
综合而言,医疗的信息化从产生、量级、质量、多样性等和大数据还有一定的距离。目前,国内还是停留在更多的结构化数据的应用上。对于现在新流行的移动设备,包括WIFI语音、监护信息的查询等等,并没有放在医院信息库里,而只是信息系统搜集的信息。
数据没有有效整合大数据驱动力何在?
卫生健康信息化和大数据,我国医疗数据根本没有有效整合,很多大量信息没有交互。对于病人的健康关照,尤其在社区,几乎不会将健康监测等数据回传。社区中心数据没有有效搜集、整合,导致数据支离破碎形不成合力。
未来几年大数据市场将迎来高速发展的黄金时期,那么,中国的大数据驱动力在哪?医院信息化经历过特别艰难的时代,内部驱动是门诊收费、住院收费。而当医院信息化有一天发展特别快的时候,外部驱动力在哪儿?其中医保是一方面,因为医保需要实时在线服务,医保需要实时结算数据。所以,我们必需探索,大数据的驱动力何在?有了真正的驱动力,才能促进医疗行业快速发展,达到一个全新的高度。
(赵志娟根据有关资料整理,文章未经作者本人确认)