- 2017-06-27 14:05
- 作者:刘中正
- 来源:HC3i中国数字医疗网
互联网中分布着许多独立开发、结构各异的生物学数据库系统。如何实现不同数据源的整合,方便生物学家检索利用这些数据,挖掘海量数据中潜在的知识,是目前生物信息学领域的研究热点之一。在生物医学领域,本体理论为知识的获取、管理、发现和展示提供了强大的知识表达和推理能力,被用于解决数据资源的异构性问题,并对各种领域实体进行语义标注。最终,生物医学本体被认为是一种具有潜力的,能够促进数据整合研究的指导理论和方法。
6月24日,由HC3i中国数字医疗网和中关村互联网产业联盟移动医疗专委会联合主办的2017中美智能医疗大数据峰会在北京成功闭幕。会议期间,密歇根大学医学院副教授何勇群发表了《生物医学本体开发与应用支持标准化和整合的大数据研究与精准医学》主题演讲。
何为本体?
“本体是用于表达实体和实体之间的关系,可以自动被电脑和人类所理解,它具有支持推理和人工智能的功能。”何勇群讲到,本体的本质概念就是整合数据。它具有可以作为增强版的术语系统、知识库,以及也可以作为元数据的标准化表达,让不同的医院和社区共享的作用。
在目前的生物医学领域,几百种生物医学本体已经被开发和报道。同时,每种本体内涵、外延以及大小也是不一样的。面对这些情况,如何准确和有效地研发新的本体呢?对此,何勇群总结了三条有效的方法:
顶层设计:用统一的上层本体与结构;
拿来主义:尽量直接用已有的成熟的本体条目;
集约化制造:利用设计模式(design pattern)集约化建立和注释新的本体条目。
生物医学本体在大数据与精准医学上的应用
用于基因组学数据分析:Gene Ontology (GO):几乎任何与基因和蛋白有关的生物医学大数据分析都要用到GO;
用本体构建知识库-疫苗不良反应本体:Ontology of Vaccine Adverse Events (OVAE);
用本体构建知识库并做出科学预测 -抗风湿中药本体:Ontology of Chinese Medicine for Rheumatism (OCMR);
本体用于临床数据分析 - ORDI: Ontology of Respiratory Disease Investigations (呼吸系统疾病调查本体)
ORDI (呼吸系统疾病调查本体)-basedData Model:基于 ORDI 的数据模型可以实现疾病调查临床数据的标准化,查询,整合与分析;
“在大数据与精准医学的理念中,本体更是发挥着不可替代的基础性作用。与生物医学本体有关的新技术使得本体的作用有了更充分的体现”,何勇群表示,本体、理论与智能计算分析的结合,更加充分地促进大数据的研究与精准医学的发展。
随着本体领域的不断发展和完善,以及本体思想在生物医学领域的确立和相关工作的不断推进,本体研究必将在生物学相关知识自动挖掘、信息整合、信息整理、数据库构建等方面发挥重要作用,为生物医学信息与知识的高效而准确的沟通和转播提供有力的帮助。