- 2017-06-27 18:16
- 作者:董文颖
- 来源:中国数字医疗网
中国的医疗正在迈入“大数据”时代,发展了这么多年的传统医疗行业,现在要跨入“互联网+”的频道,其固有的复杂性和特殊性致使转型难度不容小觑。就拿一个初具规模的医院来说,每天需要接待上万的患者前来就诊,患者的基本信息、影像信息等汇集在一起,那将是一个非常庞大的数据。如何利用好这么数据,使其发挥最大的作用,成为了关键。
2017年6月24日由HC3i中国数字医疗网、中关村移动互联网产业联盟移动医疗专委会主办的“2017中美智能医疗大数据峰会”在京成功举行。专注于云计算、大数据与智慧城市等领域创新研究与行业实践的北京睿至大数据有限公司(以下简称“睿至”)也展示了其在医疗大数据方面的成果,该公司的医疗大数据产品经理王猛表示,“医疗大数据有很多类型,目前公司的定位在临床数据。基于这些数据进行整合、分析,最终服务于医生、患者和科研三个方面。”
北京睿至大数据有限公司医疗大数据产品经理 王猛
发现问题
医院临床大数据可以分为四个类型,即有结构化的数据,半结构化的数据和非结构化的数据,以及外部数据。现在结构化的数据各个医院的应用比较得心应手,半结构化数据和非结构化数据的处理,目前还处于探索阶段。从这些数据着手,发现了如下三个问题:
第一,数据非标准化。缺乏标准,各系统数据规范不一致,大量无效脏数据。
第二,病历非结构化。电子病历、诊断报告等非结构化数据,传统处理技术无法识别其含义。
第三,数据分散。院内业务系统由多家开发商提供,数据分散、共享性差。
基于这些问题,也将会对病历搜索、科研管理、辅助决策造成影响。
解决问题
针对上述问题,睿至构建了医疗大数据平台,开发多个方向的应用系统,聚焦医生应用、科研应用、患者应用,更好的帮助医生、患者以及医院管理层进行医疗数据的深入分析、挖掘和利用。王猛介绍到,该平台具有三个特点:
一、数据标准化。以患者为中心,按照标准数据格式整合医疗业务和医院管理的数据,建立全院级的信息资源中心,并在此基础上开放各种标准的数据访问服务。
二、高性价比影像存储。使用hadoop大数据存储技术,大量存储快速增长的影像数据,并能快速提取。
三、非结构化数据应用。通过机器学习、自然语言理解技术,对非结构化数据进行后结构处理,最终存储为结构化数据,并支持对它的搜索、利用。
医疗大数据平台整体架构图
在该医疗大数据平台上,可以实现如下功能:
1. 医疗数据模型构建。医疗数据模型构建完成后,可以形成统一的数据结构和数据内容标准。其中在医疗数据结构模型中,针对临床数据,形成13个业务域分类,共485个数据字段,6000+个指标;
2. 病历后结构化。可以将病历文书中的症状、体征等非结构化数据进行结构化存储,提取完成后通过明确的症状和体征表现,可以更有针对性的搜索病历,更好的帮助医生进行诊断决策;
3. 诊断数据归一。通过人工智能加人工标注的方式,对存在大量同义词的诊断等专业术语,进行识别同义词并构建同义词库,从而避免按诊断搜索时数据不完整等问题;
4. 搜索功能。提供病历搜索、精准搜索、患者全息诊疗信息查看、患者自助查询等一系列搜索功能;
5. 高级科研管理。整合所有结构化和后结构化数据,实时获取准确病历数据,并以图表形式呈现。帮助医生优化科研耗时,极大提升科研效率;
6. 辅助决策。通过灵活动态的指标数据展示,帮助医院决策层、管理层更清晰的了解医院当前运营现状,帮助医院更好的识别风险,实现提早控制和辅助决策;
7. 辅助诊疗。医疗数据平台传输影像原图辅助诊疗系统,辅助诊疗系统进行分析,并传输回医疗数据平台做为影像辅助诊断帮助医生进行诊断决策,同时医疗数据平台传输诊疗数据给辅助诊疗系统,辅助诊疗系统给出疾病整体治疗方案,并回传医疗数据平台,作为医生决策的重要参考。
(本文根据北京睿至大数据有限公司医疗大数据产品经理王猛在“2017中美智能医疗大数据峰会”演讲内容整理)