- 2016-06-17 17:40
- 作者:付勋艳 译
- 来源:中国数字医疗网
当前,数据分析师并未采用一种有意义的方式来变革医疗健康行业,诚然,我们拥有关于患者、医生、测试甚至治疗结果的海量医疗数据,而且其中很多信息已经无纸化、电子化,但仍然还处于学习如何实现电子数据最优化的起步阶段。
虽然也存在封闭医疗系统(如凯撒)中使用数据的口袋创新,但这并不是普遍范式。范式是个人从许多不同的医疗机构获得治疗,但他们并不能相互共享。缺乏对大型数据集的访问,数据分析师的创新必受牵制(同样受制的还有医疗合作,这是另一话题)。本文要说明的是,我们讨论的是病历(写下来的病历)中的数据,记录实际的临床治疗情况,而非管理数据或账单数据,那是医疗为了偿付和操作的代表物。
数据分享的障碍
你可能认为在新的数字时代分享数据是件简单的事,但并非如此——技术的缺陷以及缺乏激励机制导致有价值的数据仍被封锁。很多大众的电子健康病历(EHR)并没有科学设计,它们不能在系统之内与之间实现简易的数据分享。这并非偶然。我怀疑有些EHR公司失去了任何意义,因为互操作性的病历或数据导出功能在其软件中并未得到任何体现。
在我们共同合作的按服务收费的现实中,对于医生、诊所以及医院分配时间、资源和资金去分享数据,尚未有真正的财政支持。付款人和购买人有为管理、付款或治疗决策获得患者数据的签约权利,但这个任务就落到了供应商头上。供应商这样做的回报是什么呢?没什么。供应商为了数据分享而办的手续或进行的办公室访问,健康计划并不会为此额外支出。在合作医疗中缺乏财政激励,就没有医院或诊所真的愿意分享数据——因为这件事烧钱、费时、费力而且很多医院、诊所都不具备相应的技术或IT人员。如果对机构真有分享病历数据的益处,EHR具备以上特色就会更有助推力。
以现状来说,如果一项健康计划或个人想要病历数据,那这份文件就是纸质印刷或复印的。这并是人们所希望的数据流动性。
现在对于EHR缺乏互操作性有了解决的方法,通过查询数据库的目录、或向另一个数据库提取、安全上传和传输文件。在这之后,人们还是需要探索从写下的数据中发现意义。有些医疗健康信息学和政策领袖希望病历更具结构性,以便具备更简易的互操作性。然而,患者希望自己的病历只是一堆数据的集合吗?所有的细微差别和来龙去脉都丢失殆尽。所以关键挑战仍然存在:如何从非结构化的、文本部分的病历分析提取出意义和价值,用以支持分析学的努力呢?
运用认知计算来理解数据
其他行业也曾试图从非结构化的文本数据中提取意义和价值。想想从网站文本上获得的信息,曾大力推动了研究、广告和电子商务的发展。自适应算法或学习算法已经创造了运用于网站叙事法之内的学习模式和推断知识。这是认知计算的核心所在。这些算法充斥在网络中的海量数据之中,并被派遣完成特定的活动。这些算法下的统计技术被认为是机器学习,现在已被用于识别声音的领域,以及协助诸如苹果的Siri或亚马逊的Alexa之类的数字助理;整合视觉提示和类型,协助自主驾驶;甚至在棋类比赛上击败世界冠军等。
美国每年要新产生12亿份患者文档,其中有很多关于医疗健康的现实数据,如果好好发掘,定能对疾病的诊断与治疗提供有价值的洞见。然而,这些文档是由不同的临床专家在不同的环境下以不同的文本写下来的。如果试图提出一种规则导向方式来告知计算机如何读取和理解这些写下的信息,尝试运用计算机解密这些信息将会困难重重且易于出错。即使这些规则能解释和理解在一种医疗环境下临床医生使用的语言和模板,它们也不见得能在另一机构或专业实践中凑效。
相反的,正确的方法是使用自适应或机器学习算法,这种算法在目前计算机存储了大量丰富的数据集时,变得越来越强大并被广泛运用。其表现达到了这样的层次,即无需客制化能首次将临床记录从某个机构中翻译出来。
如何利用数据改善医疗健康
针对个体患者的条件和治疗史,运用自适应算法的数据挖掘技术收集医疗要览是一项大有前途的技术。然后,运用准确及时的医疗要览,我们能实施虚拟治疗试验来了解哪些对患者凑效,哪些无用。治疗和医疗抉择呈爆炸式增长,使得医生在患者治疗过程中回忆和运用所有证据显得愈发困难,这种知识将变得越来越关键。而且,随着越来越多的昂贵医疗技术投入使用,患者要承担更大的医疗成本,医生必须考虑每项诊疗抉择的成本效益。
只有当我们能运用强有力的认知技术挖掘非结构化数据来源和信息时,数据分析学才能以有意义的方式开始变革医疗健康。通过从现实的临床数据中获取知识,我们能够了解每位患者的最佳治疗选择,提供真正的个性化医疗。在这过程中,我们还将可能颠覆那些虽然广为接受但却是基于有缺陷或无代表性的科学研究之上的标准。药物治疗将更加直接和有效,治疗流程能辅助更好的结果,并将从根本上变革医疗健康消费和供给的方式。