- 2017-04-20 18:50
- 作者:佚名
- 来源:中国数字医疗网
“随着互联网云计算和互联网技术的快速发展,我们现在全球的数据已经出现爆炸式的增长,有统计表明2013年全球的数据达到了4.4JB,JB这个量级也许相对陌生,JB相当于10的6次方的TB,所以这是一个天文数字。根据ATC的统计,到2020年我们的数据预计还将增长50倍。”
在4月17日上午,国际健康信息标准化高峰论坛分论坛——健康医疗大数据语义标准化分论坛上,来自神州医疗的首席技术官张潇先生开场便向大家阐明了大数据今后在量级上的变化。
“可以毫不夸张的说,大数据的时代已经来临。在这个时代,医疗的数据其实也是可以说增长最快速也最受关注一块数据,有统计说医疗数据是每年以50%的增量进行递增的,而其他的数据大概以20%速度在增长,我们医疗数据的增长速度是其他数据的两倍左右。”
“在我看来医疗数据大致分为三大块:影像数据,组别数据和病例数据。今天,我们健康医疗大数据语义标准化分论坛来了一众嘉宾老师,与大家一起分享这个大数据的时代。”
来自中山大学中山医学院计算机中心的董楠博士向大家介绍了临床检验的信息互联互通方面的一些工作,以及在中文Loinc方面的一些工作。
“关于临床检验结果的操作,首先为什么要共享解决信息,是谁在传递这些临床检验信息,他们之间是怎么样连接的,以何种形式来传递这些信息等等。我们都有一些考虑,我们将整个项目划分成十个工作组,分别是用例组,系统加购组,流程组,CDA发展LOINC,还有互操作规划,这几个组,往下是推广和测评组,信息安全和隐私保护组,还有大数据精准医疗组,组和组之间的关系大概是这样子,我们这个研究首先采取用例方面的方式,首先进行用例的方式,在用例的基础上表述流程,在中间描述临床检验数据交换的平台架构,以及具体的信息标准,可以产出推广测评还有在大数据和精准方面的应用。”
“最终我们产出十份报告,希望能够为检验信息的互联互通提供一个参考的系统架构,我们希望提供一套CDA规范,还有一套FHIR实时规范,以及LOINC简明的操作编码指南。希望做出来一个适用于中国的信息标准的集合,也就是互操作规范。”
“LOINC是一个描述检验结果的标准,它提供了临床检验结果的描述方式,定义了临床检验结果的描述方式,并且提供了一套独一的唯一的编码。 LOINC可以作为我们国内使用的第三方的标准,但是国内目前应用的仍然太少。我们目前收集的医疗数据的质量有很大的问题,举个例子,LOINC通常把检验结果划分成六个维度,实际上目前收集的医疗数据普遍来说只能满足两三个维度,有很多的维度是空缺的。今后我们也将在试点工作中尝试推广我们的中文LOINC项目。”
中日友好医院神经内科运动障碍与神经遗传病研究中心的负责人,同时也是中国CHPO项目的总协调人和负责人的顾卫红老师,在会上与大家分享CHPO在中国的应用与发展。
“随着二代测序的发展,技术的发展,现在很多的从基因方面从科研方面迅速转到了临床应用,这个转化过程非常快,而且这个行业产业发展非常快,有很多的推动因素,但是因为发展太过迅猛,所以必然会出现问题,现在已经显示出来——连接表型信息与基因数据连接存在瓶颈。”
“伴随着科技的发展,信息的获取已不再是医学进步的瓶颈,但是对应表型信息的采集效率却严重滞后。”
“第二个方面,表型数据有它的特征,表型数据来自于临床或者来自于体检,健康管理,它具有复杂性和模糊性,而基因数据它是完全不同类型的数据。”
“第三个方面,是个体的病程进展。在不同的早期、中期、后期同一个疾病表型还有存在差异。除此之外,医疗信息和健康数据的来源,非常多样,没有统一的标准没有规范,进一步增加不确定性,这一系列因素造成表层数据的复杂、模糊。”
“HPO初衷是提供人类疾病中用于描述表型异常的标准词汇,每个术语定义一种人体基因表型。HPO最开始的来源并不是来自于临床的场景,并不是来自于医疗机构,而是来自于文献。目前它包含11896个名词,对超过4千多种疾病进行注释,之前主要是罕见病、遗传病,现在扩展到常见病,对这些疾病注释,注释项目超过115000项。”
“我希望通过HPO应用,能有利于完善整个医疗流程——医生采集表型,总结出核心表型,检测机构进行生物信息分析,进行评估,之后进行解读,这也是为什么是需要医生来参与,不能将它分割开来,HPO重在应用。”
中国医学科学院研究所的邓立宗博士在分享完SNOMED CT后表示:如果以后国家要采用SNOMED CT作为临床标准的时候有两条路径可以走:一是直接引用国际标准,这种不管它是要授权也好,首先它面临的是不是有一个能够实现本土化的问题了,是不是能够很好的迁到中国来,适合自己中国的术语描述,不管翻译也好还是适应过程也好,都需要人力财力的,需要有一个过度性的过程。另外一点就是说,我们自己要参考这个国际标准术语的一个经验,自己去发展一套本体,但是无论哪一种,都需要我们自己去加强对于国际先进术语的一个研究,这个标准术语集既是一个挑战也是一个机遇。
南通大学医学信息学的王理博士介绍到:RxNorm是由美国国立医学图书馆NLM制定的,主要目的就是为了去对常用和品牌药物命名规范这么一个系统,命名规范为了支持在药品术语和药房包括知识库系统之间的语义交互。语义交互涉及到语言学的一些东西,希望把自然语言处理这一块用在医学领域。它的主要目的把医院、药房以及其他机构通过计算机系统来记录和处理药品信息,由于这些系统可能是使用不同的药品名称,导致在这个系统互相之间进行交换的时候就出现了一些问题,为了解决药品一对一配对的问题,RxNorm提供了一个唯一的命名名称和唯一的标识符,目的就是为了能够有效的无歧义的交换药物的交换信息。
来自中国医学科学院医学信息学研究所医学知识组织研究室的李军莲主任谈到:主题词典的结构体系是从术语到概念再到主题,举个例子,我们可以看到某个主题词是肺肿瘤,那么它其实下面是由两个概念来组成的,一个是肺肿瘤这个词,还有一个是肺癌,主题词典认为肺癌是一个更窄义的概念,这两个概念在主题层面是统一到一个主题,在每个概念下面又有它不同的术语表达形式,其实这也反映了我们这些术语标准,不管什么术语标准,首先是解决一个概念不同表达形式的问题,这也是中文医学主题词典的一个主要目标和任务。
来自国家罕见病注册系统执行总监的弓孟春博士介绍到:中国国家罕见病注册系统主要是解决中国现在所面临的重大关于罕见病一个问题,罕见病其实并不罕见,病种有很多,患者有很多,总量非常大,但是因为每一个疾病的患病人群比较小,总共就纳入到一个范畴来,对于罕见病患的这个系统进行研究和跟这些患者进行登记,包括对于其他方面给予支持,对于整个中国的医学发展也好,对于产业推动也好都具有重要的意义,在全球有各式各样的罕见病的研究和系统,中国一直是缺乏的,所以我们未来希望能够构建标准统一的国家罕见病注册登记平台,开展疾病的注册和登记,了解疾病精准表型和自然的发展,最后推动主治能力一个提升,达到国际先进的水平。
会议现场集锦
ISO TC215主席,Michael Glickman先生,秘书长Diana Warner女士参看神州医疗展台后合影