方晓东:关于生命科学,现在在做三件事
- 2017-06-25 20:23
- 作者:刘鸽
- 来源:中国数字医疗网
“如果把一个人的一生进行数字化,数据量会是10TB,有100G基因的信息,也会有700G转录的信息。随着数据技术的进一步发展,包括成本的进一步下降,数据可能会超过10T。如果一百万个人,每个人都有这样庞大的数据,怎么处理挖掘这些数据,是巨大的挑战,也是更多的机会。” 深圳华大基因科技服务有限公司副总裁、首席技术官方晓东,在6月24日由HC3i中国数字医疗网、中关村移动互联网产业联盟移动医疗专委会主办的2017中美智能医疗大数据峰会上说。
精准医学,破解生命科学密码
方晓东表示,生命科学和医疗属于描述性、实验性的科研,不像数学和物理学可以很好地量化、有很多成熟规律。生命科学领域很多时候只能发现各种各样的例外,使得我们对生命科学的理解非常有限。
随着基因组测序仪的出现,生命科学领域,特别是基因组学的领域有了重大的技术突破,数据量极大地上升。计算机领域有摩尔定律,生命科学领域有超摩尔定律,测序的成本每过5个月会下降一次,使得标准的数字化成本越来越低。如今,生命科学领域数据积累的速度非常快,呈现一个数量级的变化。不久的将来,测序可以完全免费,数据存储成本则会超过测序成本,因为数据本身的价值应该超过数据样本数字化过程的成本。那么,怎样可以比较好地通过数据的挖掘得到生命科学背后隐藏的规律。
“生命科学领域里特别提倡跨尺度、生命全景的思维方式,只要有足够的计算资源和计算能力,总可以把密码破解出来。”方晓东说。
从解剖学开始,到显微镜发明,再到B超影像学技术的发展,以及随着测序技术的发展,包括质谱技术的发展,我们能够利用组学的技术,更好地从微观到宏观的角度,从贯穿整个生命周期的维度探讨生命过程,使得我们更好地理解生命周期。
一个人处于健康还是疾病的状态,不仅由遗传和内因决定,还有生活环境。精准医疗和个性化健康管理,基因并不是唯一需要考虑的,一定是贯穿组学,DNA、RNA、蛋白质、小分子、肠道、微生物、细胞、组织以及个人的思维和心情都应该考虑在内,包括饮食习惯和生活方式。比如很多慢性疾病,特别是代谢性的疾病,不能仅仅从遗传的角度解释。
数据分析,探寻生命未知隐秘
方晓东表示,在贯穿人的生命周期中,会有各种各样的疾病发生,包括感染性疾病、心脑血管疾病以及代谢性疾病等等,这每个过程中都有对应的技术、工具和方法,帮助每个人更好地了解自己的健康状态。在两个人结婚前,通过基因检测的方法,可以得到小孩得某种遗传病的风险有多大。当小孩已经处于胚胎发育过程,通过无创产前诊断技术,分析胎儿有没有身体异常。小孩出生以后可以通过基因检测方法,判断孩子是不是有一些遗传病的携带,有的时候如果知道孩子具有某一些遗传代谢病的时候,可以提前进行一些干预或者进行饮食的控制,使得小孩可以维持正常的情况。
通过数据分析,还可以发现一些有意思且非常值得探讨的现象,比如人外周血里面存在相当一部分非人的DNA。血液里除了人的基因之外还有非人的东西,从哪里来的,是不是来自食物,是否致病,这对以往的医疗或者生命科学的认识是一个很大的改变。现在没有清晰的结论,但至少在很多的数据里都发现了这样的情况。
以肠道微生物为例。在人的肠道里生活着大量的微生物,对人体的营养平衡和营养吸收,包括对很多的疾病都产生了巨大的影响。根据目前已有的研究来看,肠道微生物影响着很多熟知的疾病,包括消化道疾病、便秘、腹泻等,以及结石和肠癌。只有找到潜在的标志物,才可以清楚地把肿瘤病人和非肿瘤病人区分开。“这意味着在未来有可能通过粪便的检测和筛查,得到一个人患结肠癌的风险或者潜在的标志物。”方晓东说。
云计算平台,加速生命科研向前发展
方晓东介绍,关于生命科学,现在在做三件事:存、读、写。存就是把身体上的细胞保存下来,华大内部启动了员工健康计划,每个员工都做了自己的细胞保存和全基因组和代谢组,把标本存下来,未来某一个特定的时间段,假设需要年轻时的细胞,特别是一些免疫细胞时,就有东西可以用。读,则是把标本数字化,把DNA变成数字化的信息。最后做的工作是写,最新科研进展就是合成生物学,未来可以直接感受到合成的生命,可以合成一些认为需要的物种。
而存、读、写需要的原材料都存在国家基因库,这是国家四部委和深圳市政府委托华大基因运营管理的国家基因库,属于中国人民的基因库。国家基因库2016年9月正式投入运营,目前已经完成了第一期的验收,正在启动第二期。现在国家基因库有40多个数据库,保存了超过2000多万的标本,包括细胞和组织,每年的数据产值会超过5P。
随着大规模海量数据的出现,数据分析挖掘对传统的生物学家是一个巨大的挑战,所以需要有一个基于云端的数据平台。这个云数据平台不仅可以提供计算,还必须提供数据库和知识库,可以节省生物学者的时间。“我们成功测试了1000人的分析,可以在一天内完成数据分析工作。数据库包含成熟的分析方法和流程,以及数据库和知识库,为广大的科研工作者提供服务。希望依托测序平台和计算平台建立生态系统,所有的人都可以在生态系统找到自己的位置,大家进行广泛的合作。在打群架的年代里,单打独斗不足以在世界上有长足的发展,这是一个大科学、大合作的时代。希望依托国家基因库和自主成本可控的测序平台,未来的存读写能做得更好,希望我们的生命科学领域能够引领世界,成为时代的弄潮儿。”方晓东说。
转载请注明出处:HC3i中国数字医疗网
【责任编辑:tanxy TEL:(010)68476606】