您所在的位置:首页 > i医疗 > 医疗信息化 >  雷健波:医疗卫生大数据-从理论到实践(3)
雷健波:医疗卫生大数据-从理论到实践(3)
  • 2013-07-31 11:29
  • 作者:佚名
  • 来源:CIO时代

大数据带来的变化——对传统科研方面的巨大变化

这里一定要跟大家分享一下。大数据和医学信息学这个新学科催生了传统的科学研究方法的巨大转变,如果大家稍微偏学术一点点,最经典的就是假说驱动的方法。而有了大数据以后,就要过度到新的科学研究方法,叫做数据驱动或者是发现驱动的研究。这两个新的研究方法和传统研究方法有什么区别?传统的科学研究方法或者说传统的科学实际上是源于16、17世纪的启明运动,哲学根源是唯物主义,能观察、能测量,研究方法步骤是发现问题,其次是形成假说,这个假说就是说“估计有这样的知识存在”,最重要做实验,通过实验收集数据进行数据分析,最终得到结论,然后再进行结论的推广,这是传统的以假说驱动的科研方法。这个方法有什么问题呢?它只能解决“Know Know Problem”。从逻辑上讲,很多研究者认为传统的科学研究方法从逻辑上也有缺陷。这里不一一赘述。我们可以总结一下,这样的研究方法耗费巨大、每次收集数据时都是特定的目的收集特定数据,这些数据是没办法再利用的,而且这样的产出,比如说收集数据两三年以后进行分析,然后发现最后结论无法支持,这样的产出可以说是低产出的,这样的研究方法过分强调的是微观、局部。

我们看看大数据给我们带来什么样的科研方法,这样的方法给我们带来什么样的启迪、启示和光芒呢?这个方法源于:信息化革命,存储能力、运算能力、人工智能。哲学根源:不能用传统的方法观察、测量。这个研究方法叫做数据驱动的科学方法。步骤:第一是制定各种数据的标准、功能标准、传输标准;第二步进行信息化建设,收集数据、建立数据仓库、建立大数据仓库。有了这些数据之后,我并不知道这个数据库当中包含着什么样的知识,然后就进行算法研究,这里面有N种数据挖掘算法,然后我们可以自动搜索大数据,同时可能做10种、20种、100种的假说,不同的算法去自动检索不同知识的存在。通过自动化的过程可以在同样的大数据里挖掘出各种各样的可能潜在的知识,最后通过统计学方法得到进一步验证和结论。所以这样的研究方法有什么样的好处呢?它可以解决传统的不知道的问题。大数据里面,我们事先没有假说,并不知道可能存在什么样的知识,我们可以通过“黑盒子”的办法挖掘出潜存的知识和智慧。好处显而易见,它的花费是低的,建成大数据仓库就可以挖掘出潜在的知识。同时随着算法研究、运算能力提高,就可以一直去运行、分析。这些数据是可以重复利用的,产出是高产出的过程。这就是大数据给我们带来的方法学上的科学研究方面的,有人认为是一个巨大的变革。大家可以关注一下。这样的方法可能更支持,从传统、宏观上解决更多的问题。

从科学的领域来看,我们所知道的东西是很小的部分,中间的圆圈是我们可以通过、观察、知识预测到可能存在的知识,大的圆圈里面绝大部分的知识、科学问题,我们根本不知道它在哪里,是什么样的知识。这样的话,科学问题可以通过刚才讲的数据驱动的科学研究方法去发现、证实,用它们为我们服务。从方法学上,大数据给我们带来了一个新的科学研究方向。

共4页: 上一页 [1][2]3 [4]下一页 [查看全文]
标签:医疗大数据  
  • 分享到: