您所在的位置:首页 > i医疗 > 行业动态 >  王飞:医学领域深度学习应用面临三大挑战
王飞:医学领域深度学习应用面临三大挑战
  • 2017-07-03 14:46
  • 作者:刘鸽
  • 来源:HC3i中国数字医疗网

6月24日,康奈尔大学威尔医学院助理教授王飞受邀出席由HC3i中国数字医疗网、中关村移动互联网产业联盟移动医疗专委会主办的2017中美智能医疗大数据峰会,并发表《深度学习与计算医学》主题演讲,从技术角度介绍了什么是深度学习,以及深度学习在计算医学当中的应用。


康奈尔大学威尔医学院助理教授王飞

深度学习是实现人工智能的一种方法

近年来,深度学习变得很火热,以至于很多人认为深度学习、人工智能是等同的。王飞表示,事实上,深度学习是众多机器学习方法中的一种,机器学习则是实现人工智能的一种途径,也就是说,深度学习是实现人工智能的一种方法。

深度学习是对有层级结构的学习模型的统称,而这其中最有代表性的模型是多层神经网络。其实多层神经网络早已被提出,只是在早年受到种种约束,比如计算资源不够、数据量不够等,导致效果不是很好。直到2006年Geofferey Hinton在Science上面发表了相关的论文,深度学习才又重新被大家重视起来。而深度学习真正变得流行,是因为大家开始用深度学习在一些竞赛,例如ImageNet中达到了惊人的好的效果。最近AlphaGo在人机围棋大赛中的优异表现,更是让深度学习家喻户晓。

“相比于计算机视觉和语音等领域,由于医学有一些壁垒,比如数据、病人隐私,及医生本身保守等,深度学习在医学领域应用非常缓慢。”王飞说。

深度学习三个最流行的模型

王飞介绍,深度学习有各种各样不同的模型,其中自编码器、卷积神经网络、循环神经网络这三个模型最为流行。

自编码器。该结构包括两个部分,第一个部分是对数据进行编码,将数据映射到另外一个空间;第二部分是对这些映射进行解码,使得重构的数据与原始数据尽可能类似。编码和解码过程是对称的,根据数据类型不同,可以有各种各样不同损失函数来度量重构误差,并用来进行最小化。

用自编码器对病人进行特征学习,可以用特征做疾病风险预测,这里王飞讲解了一个西奈山医院研究的例子。他们把大约500万病人数据收集起来进行集成,每个病人以向量表示,再把所有病人向量收集起来,作为自编码器输入,通过自编码器学病人新的表达,然后预测病人将来会不会得某种病,实验表明预测效果远远优于传统方法。此外,用自编码器还可以学习新的药物特征表达。

卷积神经网络。卷积神经网络是一种流行的用于处理图像的神经网络结构,其中的基本操作包含卷积、降采样等等。对不同的操作层进行排列组合可以构造出无穷多种不同的卷积神经网络结构。目前有很多流行的卷积神经网络结构例如VGG16、AlexNet、GoogleNet等。王飞介绍,今年早些时候Stanford的科研人员用13万张皮肤图像训练了GoogleNet来对皮肤癌进行分类检测,达到了与皮肤科医生可以相媲美的结果,而该论文也以封面论文的形式发表在了Nature上。

循环神经网络。循环神经网络更擅长处理有序的数据,比如病人电子病例,如果把每个病人的病例记录按照时间排在一起,就可得到一个按时间先后顺序排列的病历事件序列。

“我们去年参加了一个由Michael FoxFoundation组织的帕金森病人分型的竞赛。因为帕金森病人特征非常散,噪声非常多,所以我们先用循环神经网络对数据进行预处理,把预处理以后的序列拿出来分析病人和病人之间的相似性,进而我们用随机近邻嵌入将病人表达嵌入到二维空间中以发现聚类结构。”王飞表示,“帕金森病人是行动障碍,并不是认知障碍,随着病情的发展,他们的认知和行动能力都会慢慢降低,因而用这种方法,可以发现在病程发展上的帕金森病的亚型,每个亚型的病人的病程演化的模式是类似的。而我们也最终赢得了该竞赛。”

“深度学习在医学领域的应用,不仅要掌握深度学习技术,还需要深刻了解医学方面的相关知识。”为此,王飞总结了医学领域深度学习应用面临的三大挑战

一是如何将医学知识融入到深度学习的过程当中去。

二是医学领域的问题通常样本量都非常有限,如何能让深度学习在有限样本下见效。

三是深度学习目前在很多情况下被当作是黑盒模型,而在医学问题中,不仅结果重要,得到结果的原因也非常重要,所以把深度学习黑盒子白盒化是另一个重大挑战。

转载请注明出处:HC3i中国数字医疗网
【责任编辑:liuge TEL:(010)68476606】

标签:深度学习  计算医学  人工智能  
  • 分享到: