- 2017-06-20 10:53
- 作者:佚名
- 来源:狐大医
大数据是个筐,什么都往里装。对于媒体有一个定义,对产品技术又是另一个含义。
面对大数据这个“热词”,上海市儿童医院院长于广军认为,研究大数据对临床研究很有好处。大数据可以克服传统研究中小样本的误差,比如选1000人测定高血压发病率,误差就会非常大;大数据可以建立知识库,有全面的信息检索;通过大数据模拟用户画像,还能够预测一些疾病的发展。
上海市儿童医院为解决医院的数据资源问题,医院建立了临床数据中心;并在第二步计划建立生物样本库,包括检测平台,个体化遗传、医学检测中心和药学检测中心,对基因组的数据进行搜集。第三是在国内建了生物医学信息研究中心,是一个大数据分析平台;于广军介绍,第四是做了一些应用示范的研究,结果如下:
1、多元数据的关联分析
环境、气候与儿童就医之间有着密切的关系,医院根据上海市五年内儿科就医的数据和天气、空气质量和温度进行关联分析,建立一个有效的预测模型。通过预测模型,可以看到儿童疾病有几个效应,包括星期效应、季节效应、春节效应、开学效应,这揭示儿童疾病发病就医的规律,同时也为医疗资源的配置,医生的排班、调班做出安排,提高效率。
2、把疾病资料数据化
专病研究,医院一方面将个人为中心的病历转化成了专病控制中心,另一方面就是做自然语言的处理,把它们变成结构化的语言,即把文本、图片转化为数字。将疾病转化为结构化的数据,比如儿童川崎病的治疗,就可以利用这个大数据开展预测性的研究;医院还做了一个基于临床大数据的儿童肺炎临床决策支持系统,利用病原学的预测,提高医生对抗生素的有效使用率。
3、疟疾药竟能治肿瘤?
于广军说,研究组将28个数据库中不同的基因组和不同的疾病排成矩阵进行分析,发现一些很有意思的现象。比如,他发现了疟疾和某些肿瘤有相同的基因组位点,比如说胰腺癌等。大家都知道诺贝尔奖得主屠呦呦发明了青蒿素抗疟疾,现在开始有人研究用青蒿素治疗肿瘤,还取得了一定的效果。也就是说,通过数据挖掘会发现一些共同的位点,进行大数据的关联分析后可以做进一步的研究。
4、儿科遗传病诊断
目前遗传病种类共有八千多种,医生不可能记住这么多。因此,研究组根据大量临床的研究的基础上形成一个数据诊断库,为临床医生提供基因型表型搜索系统,就像一个GPS。医生只要把患者的临床表型输入,系统就会提示前十位最可能的遗传疾病,提示做相应的基因组学的检查,确诊是哪一种遗传病。
这个算法已经在网上投入运行,并在不断优化,这为临床遗传学系的医生提供了一定的便利。比如儿童肥胖,可能不是单纯的肥胖,有一种遗传病叫做William综合症,患儿除了肥胖还有智力相对低下的症状,把这些症状输入后就可以辅助医生进行诊断。
于广军认为,大数据研究目前还面临很多问题,比如数据来源、数据质量、隐私保护,以及相应的人才。做大数据要跨学科的,包括搞业务的,IT专业的,以及大数据挖掘专业,大家共同合作才能开展研究。单家医院是不够的,下一步,医院还要进一步推动开放合作,推动大家在儿科协作网中建立大数据,包括挖掘分析,提升临床辅助系统为临床所用。