- 2022-10-21 11:48
- 作者:尹聪颖
- 来源:HC3i数字医疗网
近年来,中国创新药研发正在逐渐突围,并有望借助数据资源和AI算法在国际创新药领域实现弯道超车。
根据《自然》杂志发布的数据:一款新药的研发成本为26亿美元,耗时约10-15年,而最终能够成功上市的新药不到1%。投资周期长、风险大、获利慢,导致药企忽略了创新药研发,因此多年来创新药一直是我国的短板。如今这一局面正在发生改变。在庞大的数据资源和丰富的AI算法支持下,中国创新药研究正如雨后春笋般迅速铺开,创新药研究成果不断涌现。
16年前,亚马逊也是从云的荒漠中走出来的。当亚马逊云科技推出云计算的时候,云计算的概念几乎不存在。勇于探索新业务、新模式,尝试他人从未涉足过的领域,亚马逊云科技跟众多AI药物创新企业一样,大家都是行业的探路者。今天,亚马逊云科技正在帮助中国医药研究企业和机构借助AI实现创新突破,并依托自身的科技创新理念和数据驱动转型经验,助推更多创新药研发组织踏上开拓创新的征途。
亚马逊云科技大中华区战略业务发展部总经理顾凡表示,“同为探路者,亚马逊云科技不会放慢创新的脚步,会继续探索下一代云基础架构、云原生数据战略,成就更多医药创新领域的探路者,帮助他们打造更多AI药物创新解决方案,加速医药产业数字化,推动医药AI产业的可持续性发展。”
百舸争流,中国AI医药创新者从云端超越
借助AI加速药物研发让全球大牌药企看到了机会,包括罗氏、辉瑞、诺华等都有不同方式的布局。国内不少药企和第三方研究机构也在依托丰富的数据资源,开启AI药物研发,英矽智能就是其中的一员。
图为:中国药物研发管线热门作用机制TOP30(截止2022.8.8)
英矽智能是一家端到端AI驱动的药物研发公司,通过下一代人工智能系统连接生物学、化学和临床试验分析,利用深度生成模型、强化学习、转换模型等现代机器学习技术,构建强大且高效的人工智能药物研发平台,识别全新靶点并生成具有特定属性分子结构的候选药物。在亚马逊云科技的支持下,英矽智能利用自有的人工智能平台仅用30个月就将第一个项目——特发性肺纤维化研究从发现一个全新靶点快速推进到临床一期。
相比于传统创新药研发周期,英矽智能这个项目仅需30个月的研发周期就像是乘坐了火箭,如此的高效得益于背后的AI秘籍。目前英矽智能已经构建了一套由端到端的人工智能驱动的药物研发平台Pharma.AI,其中包括三个组成部分:PandaOmics、Chemistry42以及inClinico。PandaOmics是一个致力于靶点发现的多组学分析引擎,它通过破译已知的组学数据分析多种类型的组合数据发现和验证创新型的药物靶点,寻找药物在新适应症中可能的应用。Chemistry42是一个全新的小分子生成平台,利用自动化的端到端的深度学习系统,针对选定的靶点设计全新多样的有创造力的化合物,我们可以基于蛋白的结构去进行小分子的生成,也可以基于配体的化合物结构去进行小分子的生成和设计。inClinico是一款临床试验结果预测的平台,它可以预测临床试验方案的成功率,用于早期发现临床研究设计中的短板,并指导正确的临床研究方案。
“为了让这套AI研发平台触手可及,在保证高性能的前提下开放给客户使用,Pharma.AI中的三款人工智能平台软件构建于亚马逊云科技的计算存储和网络之上,让复杂的生物信息分析变得触手可及。”英矽智能业务拓展总监王珏博士介绍说。
构建于云端的AI平台能够支持不同背景的医药研发科学家们使用人工智能工具来协调分析,更好地服务全球业务,并促进跨地区之间的高效合作。
一方面,在做AI的训练和推理的过程中需要大量的计算资源,如何在需要的时候能够快速地获得这些资源,又可以在不需要的时候及时的释放这些资源来节约成本?王钰说,“我们把AI平台构建在了亚马逊云科技上,利用亚马逊云科技的Amazon EKS的调度服务,我们可以便捷的在需要的时候,启用大量的计算服务器,在完成训练和推理任务之后及时的释放这些资源节约成本。”
另一方面,如何快速地搭建Saas平台,以便服务于我们全球的客户,并保证这个平台的安全性,包括网络安全数据安全以及数据合规?“我们将AI平台设计为基于SaaS的服务,并充分的利用亚马逊云科技上面的多种应用服务,像搭建积木一样快速高效地完成整个系统的构建,同时亚马逊云科技完整的安全性服务以及高合规的要求也为我们提供了各种合规方面的证明,避免了网络和数据等平台安全性的隐患。”她说。
在亚马逊云科技的大力支持下,特发性肺纤维化研究项目快速地从1拓展到了N,自2021年至今已经发现了8个临床前侯选化合物,这8个项目分别在特发性肺纤维化、肾纤维化、肿瘤以及免疫等多个领域。
飞龙乘云,亚马逊云科技加速AI药物创新研究有妙招
英矽智能的成功并非偶然。十年间,亚马逊云科技服务了全球超过4200个生命科学行业的客户,包括全球前九的制药企业,在中国,亚马逊云科技也服务了超过400家的生物科技企业,英矽智能就是其中之一。
“亚马逊云科技致力于加速药物发现从实验室到真实世界的数字化之旅,目前正在帮助中国药物研发机构探索基于数据加速药物创新研究的新方法。”顾凡介绍说,亚马逊云科技提供的解决方案覆盖了生物医药的全流程的价值链,可以帮助客户快速高效地进行各种药品和医疗设备的研发、试验、制造和商业化,同时满足严格的合规要求。
截止目前,亚马逊云科技与亚马逊云科技的行业客户已经在多个药物发现的场景落地了亚马逊云科技的解决方案,如:基于Alexa语音控制的智能实验室,利用深度学习去加速靶点发现,加速化合物筛选的方案。亚马逊云科技还率先将量子计算用于新药研发。
多年来,亚马逊云科技基于在生物医药领域的积累,总结了数据驱动型生物医药AI企业面临的挑战:
第一 大多数生物医药AI创新企业缺乏一个明确的数据平台战略;;
第二 高速的数据增长带来的存储、分析以及数据创新的成本太高
第三 难以找到发挥数据价值的场景;
第四 不清楚应该使用什么样新技术或者产品来支持业务创新;
第五 企业内部人员技能不足,难以支撑一些创新型的数据项目;
第六 企业缺乏数据的治理和安全保护的能力。
针对这些挑战,亚马逊云科技基于很多成功的数据驱动型生物医药AI企业的经验,总结了一套“3+1”云原生数据战略,包括:三个支柱和一个基石。
支柱一,采用云原生的数据基础设施,存储和处理生物医药数据。亚马逊云科技正在逐步完善不同类型的云原生数据库、数据分析服务,以满足不同应用的需求;开发迁移工具,帮助医药用户从传统数据库迁移到云原生数据库;向无服务器化演进,当客户采用Serverless的数据库和分析服务时更容易自动扩容,成本更加地灵活,以及最重要的进一步去减少管理的成本开销。
支柱二,用智能湖仓2.0的架构打破数据孤岛,实现医药数据一体化融合的分析。医药数据AI研究首先要打破数据孤岛,构建数据湖,然后建立跨数据湖、数据仓库、数据库等不同数据源的一体化分析能力。亚马逊云科技智能湖仓2.0的升级,重点满足的需求就是数智联动,增强医药数据分析和人工智能之间的联动能力。
支柱三,数据驱动智能创新,利用机器学习重塑医药创新引擎。亚马逊云科技的机器学习四步走实践可以帮助医药客户快速迭代创新,而赋能客户产业化的机器学习能力是实现规模化机器学习的核心。
一个基石,医药数据安全与数据治理。在数据驱动的医药AI创新这一全新领域,企业要想充分利用数据挖掘价值,需要在保障数据安全的同时积极开展医药数据治理。”数据治理不是一个单纯的技术问题,它是一个人员、流程和技术的一个组合。“顾凡认为,数据治理应该具备的能力包括:从主数据管理、数据的统一授权安全管控再到数据的分级、目录、集成、质量、血缘等等,客户可以用Lake Formation去实现数据的统一授权和安全管控,以及采用亚马逊云科技上丰富的合作伙伴解决方案去解决各种数据治理需求。
总体来说,为了在繁杂的医药数据里面找到价值,数据就必须进行统一的编目。为了能够让医药企业内部的数据和数据分析民主化,数据的安全保护、访问授权就必须先行。
风起云涌,亚马逊云科技将成就更多中国医药创新探路者
根据Pharmprojects数据库,目前中国药物研发管线共检索到714种作用机制,几乎占到全球的三分之一。其中,中国的CAR-T试验数量目前已经是世界上最多的,CAR-T也被认为是国内企业最有希望与全球研发同步的领域之一。
在亚马逊云科技的帮助下,越来越多像英矽智能一样的AI药物研发企业正在崛起。
顾凡说,“这一切才刚刚开始,面对更多的未知,亚马逊云科技会和探路者一起去探索新的可能性和最优解,云技术给了亚马逊云科技重新想象未来一切可能性的机会,它为所有人提供了一条通往真正转型的道路。亚马逊云科技成为探路者,也将成就医药创新探路者。”