您所在的位置:首页 > 资讯中心 > 背景文章 >  数据挖掘找好药
数据挖掘找好药
  • 2011-10-28 10:53
  • 作者:尼尔·萨维奇
  • 来源:麻省理工科技创业

牵涉到数百万人的医疗记录数字化改革为我们开启了一个虚拟研究的世界。

1992年,抗抑郁药物帕罗西汀(Paxil)获准上市;1996年,降胆固醇药物普拉固(Pravachol)正式开售。相关药品生产企业的研究证明:每种药物在单独服用时是有效且安全的。可是,患者要是同时服用两种药会怎样呢?

在挖掘分析过数万例患者的电子病历后,斯坦福大学的研究人员很快发现了一个出人意料的答案:同时服用两种药物的患者血糖含量较高。这对于糖尿病患者来说影响更大,过多的血糖对他们来说是一种健康威胁。

这项研究只是科学家利用数字化医疗记录解决问题的一个例子。科学家还通过分析血糖检测结果和药物处方,来寻找隐藏的规律。“你不必再召集患者去做临床试验,那样做的话花费太大了。”罗斯·阿特曼(Russ Altman)讲道,他是斯坦福大学生物医学信息学培训项目(Biomedical Informatics Training Program)的负责人。阿特曼的团队在今年六月份发表了上述关于帕罗西汀和普拉固的研究成果。

电子病历及其计算机可读条目的普及为医疗数据挖掘提供了新的机遇。科学家不再局限于通过召集志愿者来开展计划好的研究,而是更多地从现实生活中的计划外实验中筛选数据并开展虚拟研究。这些计划外实验的数据保存在许多医院的医疗记录中。

数据挖掘 

数据挖掘找好药

这样的技术使得研究人员可以找出在药物批准上市时无法预见的问题,例如一种药物可能对特定族群产生怎样的影响。这些技术也被应用到经济问题的证据揭示当中,例如超额计费及非必要医疗程序等。对医疗记录的数据挖掘“不仅将为研究带来好处,还会提高医疗服务系统的效率。”玛格丽特·安德森(Margaret Anderson)说,她是一家位于华盛顿特区名为“快速治疗”(FasterCures)的智库的执行董事。

现在,一些使用电子记录的大型医院开始雇佣全职的数据库研究团队。劳伦斯·迈耶(Laurence Meyer)是美国退伍军人管理局盐湖城医疗中心(Salt Lake City Veterans Administration Medical Center)的研究小组副组长。他说,他了解到有超过100个项目正在使用退伍军人管理局保存的600万名患者的电子记录。这些患者分布于全国152家医院和804家门诊诊所。

“如果你只看一家医院的病例,比方说肥大型心肌症病例,你可能十多年见到20或30例,现在我们突然能看到几千个病例。”迈耶说。

研究人员表示,大量的患者记录对于研究是至关重要的。在2002年有一个从数据库中发现的医疗案例:研究人员与位于加利福尼亚州的管理式医护提供商凯泽永久医疗公司(Kaiser Permanente)一道,披露了年销售额高达25亿美元的止疼药万络(Vioxx)会引起患者心脏病突发并致患者死亡。这是在仔细梳理800万患者病历之后,凯泽公司才发现该药的这种影响。随后,万络退出市场。

同样,斯坦福大学的阿特曼团队正在开发一些工具,用来筛选美国食品与药物管理局(. Food and Drug Administration,FDA)的不良事件报告系统(Adverse Event Reporting System)中的数据。这个系统是一种包含几百万份受害患者报告的数据库。研究人员开发出一种算法,搜寻那些服用广泛开出的处方药物、遭受类似糖尿病症状影响的患者。其中反馈出的一个强烈信号就来自帕罗西汀和普拉固的联合服用,而这两种药物在分别使用时与血糖变化无任何关系。

为了确证这条线索,阿特曼团队对患者电子记录进行了深入研究,以区分出服用上述两种药物中一种以及两种同时服用的患者,并分别对这两类患者进行血糖检测。在斯坦福大学所保存的141000份记录中,研究人员只发现了12个上述类型病例,于是他们向哈佛大学医院和范德堡大学医院寻求更多记录。阿特曼说,他的团队最终找到239位患者,这足够开展相关虚拟临床试验,来证明上述两种药物联用会使血糖升高,并会为糖尿病患者带来危险。

尽管取得了这些成功,阿特曼同其他医学研究人员都认为,数据挖掘研究会受到现实中各种障碍的影响。绝大部分医疗信息仍以纸质记录和手写记录方式保存,不容易被计算机读取或在研究者之间分享。根据美国疾病控制和预防中心(Centers for Disease Control and Prevention)的数据,2009年使用电子记录的医生人数少于医生总人数的1/4。就算那些记录存在,各医院对相同症状的不同描述方法也让研究人员深感头疼。

在其他情况下,出于隐私或司法考虑,有价值的数据并不能被公布。今年,华尔街日报(Wall Street Journal)请求美国政府大量公布医保支付数据,该报认为对此类数据的挖掘能够清楚地揭露出其中的诈骗行为。针对此事件,美国政府的说法是要保护医生的隐私,而患者的隐私权也常常对研究造成限制。

患者的支持者认为数字化数据应当首先在医药领域发挥作用。“使用这种聚合式数据能为数据挖掘研究提供极为广泛的可能性。”快速疗法(FasterCures)的安德森说,“我们正在发问:‘为什么我们不把更多的注意力放在那上面呢?’”。

【责任编辑:夜阳 TEL:(010)68476606】

标签:医疗记录数字化改革  电子病历  数字化医疗记录  医疗数据挖掘  
  • 分享到: