- 2021-12-20 17:25
- 作者:程泱溥
- 来源:HC3i
自20世纪70年代以来,我国恶性肿瘤的发病率及死亡率一直呈现上升的趋势。在与肿瘤斗争的过程中,高通量检测技术的进步,对肿瘤的分子分型和预后发展提供了重要的参考。2020年12月,国家卫健委连续印发《抗肿瘤药物临床应用管理办法(试行)》及《新型抗肿瘤药物临床应用指导原则(2020年版)》等文件,明确指出需进行基因靶点检测的靶向药物,在使用前需经靶点基因检测确认患者适用后方可开具。
政策的推动下,基因测序一跃成为实现个体化治疗、避免过度治疗的重要手段,有效推动治疗模式向规范化、个体化的循证医学方向发展、有效改善了肿瘤治愈率低、死亡率高的窘况。
不仅如此,基因测序在遗传病的探索上同样发挥出极大作用,比如,帮助人类明确了亨廷顿氏舞蹈症、遗传性结肠癌和乳腺癌等单基因遗传病,以及心血管疾病、糖尿病、神经精神类疾病(阿尔兹海默症、精神分裂症)、自身免疫性疾病等多基因疾病......基因测序的新进展为诸多疾病的基因诊断和基因治疗奠定了深厚基础。
从科研到临床再到健康管理,基因测序的应用范围越来越广、应用场景也越来越多元。在政策和需求的双重驱动下,如今的基因测序已经逐渐常态化,走近大众身边。
数据爆炸式增长,基因测序行业面临“生长痛”
现代科技和生物医学的发展带来了临床医学领域的全面进步,通过精准医疗实现医源性损害最小化、医疗耗费最低化以及病患获益最大化,成为医疗服务的关键发展方向。因此,推动精准医疗落地对实现我国医疗改革目标、打造“健康中国”具有重要战略意义。
那么,基因测序技术是如何助力精准医疗落地的呢?通过病人的基因组序列可以推断出酶的形状,进而构建准确的蛋白质三维结构,主治医生可以借此筛选匹配药物、给出最优处方。无可置疑,基因测序技术的发展让精准医疗落地未来可期!
时至今日,基因测序已经在更多医疗场景中得到广泛应用,然而发展与挑战总是相伴相生,医疗行业想要充分挖掘基因测序的应用价值,仍存在诸多痛点:
01 数据高效处理“遇逆风”
从13年到1天以内、从30亿美元到500美元,基因测序通量的快速上升大幅降低了该技术的周期和成本。高通量、低成本、高准确度等特点,让基因测序获得更加广阔的发展空间,但基因数据分析仍然面临诸多困难:数据处理量大、分析时间长,IT系统运维成本高、管理开发难度大,数据长期存储成本高、归档困难,精准医疗应用转型升级缺乏成熟解决方案……显而易见,基因测序行业所面临的最大挑战已不再是基因测序技术本身,而转变为“如何高效处理数量巨大的基因数据、如何深层挖掘基因数据的价值”——基因测序行业正处在海量数据处理带来的“逆风”之中。
02 多软件数据流通“存窒碍”
基因测序是一个非常复杂的过程,其中包含了基因采样、样本制作、数据下机、生信分析、后基因测序、数据归档等多个环节。从基因采样到生信分析,不可缺少的一个关键步骤,就是将生物信息转化为能够进行分析和解读的数据信息。在此过程中,会涉及到诸如Khmer(数据与处理软件)、SOAPdenovo-trans(转录组拼接软件)以及Transrate(拼接质量评价软件)等多种不同类型的上层软件,从而产生多种不同格式的基因数据,大大增加了应用数据访问协议的多样性、为跨协议数据流转和迁移造成了极大阻碍。
03 海量基因数据“难容身”
NGS(Next Generation Sequencing,新一代测序技术)的诞生让基因组研究迈进高通量时代。据统计,当前最先进的基因测序仪单台每天产生的测序数据可达6TB,每年产生的数据则高达数十PB,这些海量数据有着极高的研究价值,因而需要永久保存。如何应对基因测序PB级数据的存储需求、为数量巨大的基因数据打造可靠的“容身之所”,已经成为基因测序行业发展亟待突破的现实挑战。
夯实HPC数据底座,助力基因测序“数海”扬帆
《“健康中国2030”规划纲要》的提出,加速推动了我国迈进“预防大于治疗”的时代。在疾病防治关口前移的共识下,基因测序逐渐成为推动健康产业发展的强大助力。然而,作为信息技术与生物技术紧密结合的行业,高效的数据处理能力是决定基因测序行业能否稳步发展的重中之重,基因测序对于HPC(高性能计算)的要求也越来越严苛。正是因此,加速构建与HPC相匹配的高性能存储必然是满足基因测序业务需求的关键。高性能数据分析(HPDA)存储作为HPC产业的重要数据底座,正在基因测序领域发挥出越来越关键的作用。
破风|高性能助力数据高效管理
基因测序技术正在成为医疗健康发展的核心推动力。在医疗行业不断攀升的应用需求驱动下,数据高效管理成为基因测序行业发展亟待获得的“超能力”。作为业界首个面向HPDA的分布式存储,华为OceanStor Pacific为行业递上提升数据管理能力的“魔法棒”。该存储解决方案以其更稳定的高带宽,通过优化存储整体性能,大大缩短基因组分析测试时长、提升测序效率,助力基因测序加速深入到更多医疗场景中,赋能医疗泽惠民生。
通络|多协议互通加速数据流转
上文有提到,在基因测序过程中会应用到数据处理、转录组拼接、质量评价等众多上层软件,因此在数据分析时会涉及FASTA、FASTQ、GTF和GFF等多种格式数据,为基因数据的存储和利用带来桎梏。如何破解此难题?华为OceanStor Pacific存储成为基因测序行业击破数据流转阻碍的“利器”,它支持NFS、CIFS、HDFS和S3协议,用户可以通过多个协议对同一份数据进行读取,在无需数据迁移的同时保证语义无损和稳定高性能,从而帮助基因测序机构轻松打通数据“脉络”、破除基因数据处理过程中的格式壁垒。
包容|大容量让数据“身有所属”
临床辅助诊断、个体化治疗、产前诊断......当基因测序技术日益广泛的应用在不同医疗场景中,将有越来越多的基因数据被累积下来。由于基因数据价值的不断凸显,长久保留成为必然需求,这对机房空间、功耗、存储成本都提出了更为严苛的挑战。基于此,华为OceanStor Pacific存储全新推出了系列化超高密硬件,支持不同硬件间的数据自动分级,单位空间容量提升20%,全面降低了HPC场景的存储成本;此外,华为OceanStor Pacific系列高密大容量产品通过高密特性实现了60%以上的机柜空间节省,为基因数据打造可靠稳定的“容身”空间,让行业无惧海量数据考验。
赋能|当HPDA走进医疗
华为OceanStor Pacific存储正以其高性能、多协议、大容量等杰出特性,全面加速HPC向数据密集型演进。当它走进医疗,会创造出哪些“新可能”?
30X人类WGS胚系变异分析时间从24小时缩短至7分钟,至此人类全基因组分析迈进分钟级时代!这一具有跨时代意义的创举,正是基于多组学数据加速分析平台实现的。该平台于2021年9月由四川大学华西医院、华为技术有限公司及合作伙伴联合发布。其中,华为OceanStor Pacific为该平台提供了稳定可靠的海量数据底座,在支持多样化算力的同时,兼备稳定性和可靠性,为基因测序过程不中断提供坚实保障,实现了海量基因数据的长期储存,为基因测序行业高质量发展添力;
交付报告时间由15天缩短至7天、存储性能提升25%-30%......华大基因是怎么做到的?据了解,华大基因目前约有测序仪200余台,数据计算量巨大。如何快速进行数据分析处理?如何存储和管理爆炸性增长的海量数据?如何满足未来发展需求?都是华大基因亟待解决的核心问题。华为基于自身在HPC领域的丰富经验,深入华大基因业务流程,通过华为OceanStor Pacific赋能华大基因,直面数据挑战,为提升基因测序能力创造更多可能。
用创新之力,将数据能量“载入”医疗生态发展“DNA”
目前,基因测序技术被越来越广泛地应用在药物研发、疾病研究、疫情防控等诸多场景中。据BBC Research数据显示,近年来全球基因测序市场规模呈现连续增长趋势,且增速普遍超过10%,2020年全球基因检测市场规模已达到138亿美元,预计到2026年规模将突破400亿美元。
无论是发展趋势还是市场表现,都证明基因测序技术在推动医疗生态发展过程中扮演着重要角色,且拥有无比广阔的未来。探索数据价值、激发数据能量,不仅是加速基因测序等新兴行业发展的关键,更是泽惠医疗、造福人类的关键。下一步,华为将充分发挥自身在高性能数据存储和先进基因数据管理系统上的技术积累,以数据为驱动、以创新为引擎,激发数据磅礴能量,赋能医疗生态稳步发展。