- 2017-05-04 15:04
- 作者:石晨露
- 来源:中国数字医疗网
语音识别技术在欧美的医院中已经得到广泛应用,但要克服嘈杂的环境、识别复杂的医学专业术语、满足不同语速和口音使用者,成为可靠、好用的技术,还有许多技术难点需要克服。在2016年4月,北京云知声信息技术有限公司(以下简称:云知声)与协和医院达成合作,正式切入医疗领域,信息化让看病变得简单,像协和医院开发的“医疗智能语音录入系统”一样,方便了医生,更实惠了广大患者。云知声资深技术专家刘升平博士提到:“我们希望将人工智能服务和医疗应用产品相结合,一起打造我们的智慧医院。”
AI+医疗
从技术的角度看,人工智能技术可以分为感知智能、认知智能和通用智能三大技术。刘升平介绍:感知智能类似于人体感觉器官对应的能力,包括语音、图像、手势和体感。有感知还不够,最重要的是认知能力,人类智能能够统一世界很重要的一点就是具有语言能力,语言促进了文化交流和文明进步,有了语言,需要沉淀知识,医疗领域就有非常多的知识,有了知识就要应用起来,这就是决策,一个医生最重要的不是他会说,而是看病的能力,这是体现决策的能力。语言、知识和决策体现了人类的认知能力。
通用智能包括自主学习和全场景。现在的人工智能都是在特定的场景下解决特定的问题,但是除此之外,人工智能学习技术也需要突破性的变化,目前的学习都是经过大数据训练模型,训练解决问题。但是通用智能更像人类从小就开始不断地与外界交互,智力水平不断地进步。
基于人工智能深度学习技术、大数据和计算集群三架马车快速发展推动了人工智能技术的飞速的进程。当人工智能技术与医疗相结合,从技术与产品成熟度和医疗领域接受程度这两个角度看,目前发展得比较成熟的有语音听力,把语音识别和听力结合起来,另一方面就是视觉图象,利用技术做影像辅助诊断。
医疗AI云实践
人工智能语音技术是感知智能领域发展最成熟,也是最接近人的水平的技术。人工智能语音病历技术在国外已经应用了很多年,M*Modal公司已经覆盖了全美的医生,在美国已经实施了大规模的应用。
在中国,医疗语音录入也是最近这两年才开始发展的,刘升平分析:中文医疗语音识别难度非常高,医疗领域会有很多的专业术语,以及特殊单位和特殊符号,此外国内医生有些会带有浓重地方口音的普通话。另一方面,就是医生的使用习惯,以前可能习惯用键盘去写病例,用模板拷贝、粘贴,同时,医院使用的系统集成复杂,与语音结合起来,也是一个比较大的问题。
云知声一直深耕医疗语音录入技术,做技术创新,针对医院门诊嘈杂环境下语音识别技术所面临的问题,不断进行技术改进,用最少的训练样本达到业内最佳的识别精度以及最高效的识别速度(领先对手三倍)。首先在抗噪特征提取,独创的语音增强、信道及说话人规整技术,有效抑制环境噪声干扰,极大地提高了语音识别在门诊等复杂环境下的准确率。其次,在医疗数据建模及理解,收集40G医疗文本,对200个医疗特殊符号进行优化,针对医疗应用专业术语进行垂直行业精准数据建模;向各个科室提供定制优化服务,达到最优输入体验。最后,也支持私有云或混合云部署方案,为医院在企业内部搭建语音识别云服务,同时服务于移动查房系统、HIS系统、影像系统等多种终端设备。
云知声基于医疗AI云的解决方案为软硬一体化的语音病历:1、医疗语音识别,运用国际领先的中文语音识别与转写技术,深耕医疗语音录入方案,识别准确率超过95%;2、语音录入客户端,单独提供语音录入客户端,无需与原有信息化系统集成,即插即用;3、医疗专业语音录入麦克风,采用欧美医疗语音录入专业麦克风,麦克风、按键、鼠标一步到位。
“我们产品的是以输入法的方式存在,所有输入的地方可以用语音,不需要跟现有的系统集成,这样大大降低我们的书写行为。”刘升平说道。
云知声在国内多家医院做了实地调研,语音识别已在国内30多家大型三甲医院医生中使用,收集到400多份调查问卷。调研发现:约90%以上医生认为语音识别准确率超过95%,达到可用水平。约48%医生认为语音录入系统每天可节省1小时以上时间,约47%医生希望立即使用。
(本文根据“2017中国医疗云技术领袖峰会”上云知声资深技术专家刘升平博士演讲内容整理)