- 2021-10-28 14:29
- 作者:尹聪颖
- 来源:HC3i数字医疗网
随着越来越多的大数据应用在医疗健康领域落地,比如:医保数据测算、基因药物研发、临床新疗法研究...... 与此同时,隐私数据泄露、临床数据超范围使用带来的风险亦是触目惊心。
面对大数据产业飞速发展可能带来的安全问题,国家迅速出台了《网络安全法》《数据安全法》《个人信息保护法》等一系列法律规范,严格管控数据的采集、管理、利用和对外提供。
如何合理合法的使用健康医疗数据,满足健康医疗数据使用合规性,成为健康医疗大数据领域各环节发展绕不开的一道槛。
近期HC3i采访锘崴科技创始人王爽教授,邀请他分享国内健康医疗大数据发展状况、数据安全监管要求、隐私计算技术优势以及如何安全合法的开展健康医疗大数据研究。
(推荐阅读:健康医疗大数据“魔镜”出世,你的隐私谁做主?——中美智能医疗大数据探秘系列采访之:加州大学圣地亚哥分校 蒋晓谦、王爽)
看我72变!国内健康医疗大数据应用百花齐放
随着国内健康医疗领域数字化建设快速发展,互联互通水平不断提高,医院、体检机构、基因检测机构、互联网诊疗平台和各种智能设备源源不断的产生大量的健康医疗数据。从电子病历数据、化验检验数据、影像数据、药品数据、治疗数据以及费用数据,到基因数据、互联网诊疗过程数据、个人移动健康数据,无论是数据类型还是数据体量,都在以惊人的速度生长。
庞大的人口资源、可观的数据规模和丰富的数据类型,为健康医疗大数据研究提供了沃土,各式各样的健康医疗大数据研究正在国内广泛落地。
●国家队积极布局健康医疗大数据。例如:中国电子和联仁健康分别承建了东部中心和北方中心两朵省级医疗云,省级医疗云连通省内各级医院和卫生服务中心,数据以病案首页数据为主,主要用于服务药物经济学研究、医保DRG、DIP测算、商业保险核保等。
●大数据被广泛用于临床研究。例如:神州医疗跟国家癌症中心合作,收集全国的癌症数据建立专病数据库;此外很多药厂需要基于临床数据做联合研究或真实世界证据研究。
●诊疗数据用于智能问诊机器人训练。互联网诊疗、导诊机器人积累了大量的诊疗互动数据,这些非结构化的问诊信息可以用来训练机器人,用于优化智能问诊。
●基因领域的大数据应用更加丰富。如:疾病早筛、疾病诊断等,还有通过基因数据分析做药物/保健品的推荐,或者针对特定基因突变用户精准推荐某些药物或保健品。
在此背景下,数据安全和隐私风险的威胁也日益严峻。
“从医院、体检中心、保险公司、AI公司到药厂等,无论是数据提供方、算法提供方还是数据需求方,都必须充分考虑数据安全和隐私保护问题。”王爽教授说。
利剑高悬!健康医疗大数据迎来信息安全强监管
2021年9月1号,《数据安全法》正式实施。2021年11月1号,《个人信息保护法》正式实施。
企业和组织要开展健康医疗大数据研究,将面临更加严峻的合规性挑战。
《个人信息保护法》要求相关机构需严格保护敏感个人信息——《个人信息保护法》将生物识别、宗教信仰、特定身份、医疗健康、金融账户、行踪轨迹等信息列为敏感个人信息。具体来说,基因数据、指纹、声纹等个人生物识别信息,以及家族病史等个人健康生理信息,既属于人类遗传资源信息,也属于个人敏感信息。
对于健康医疗大数据企业或组织来说,一旦出现上述信息泄露或将面临三重责罚:
●行政处罚 《个人信息保护法》的处罚力度非常高,超过了GDPR。GDPR对违规的处罚是最高致2000万欧元和4%的全球收入,《个人信息保护法》对违规的处罚是最高致5000万人民币和5%的全球收入。
●刑事处罚 违法《个人信息保护法》还可能面临刑事处罚,构成违反治安管理行为的,依法给予治安管理处罚;构成犯罪的,依法追究刑事责任。此外,依据《刑法》第二百五十三条之一【侵犯公民个人信息罪】违反国家有关规定,向他人出售或者提供公民个人信息,情节严重的,处三年以下有期徒刑或者拘役,并处或者单处罚金;情节特别严重的,处三年以上七年以下有期徒刑,并处罚金。
●民事赔偿 一旦个人信息泄露可能会涉及大规模侵权问题,受害的当事人可以发起集体诉讼。
无论是B2C还是B2B企业都要收集管理数据,企业或机构必须先攻克数据安全和隐私保护问题,因此对于数据隐私的敏感程度和意识都在显著提高。
隐私计算来了!打开健康医疗大数据使用合规通道
传统的网络安全公司主要致力于数据在储存和传输的时候的安全防护,极少针对数据使用的安全保护技术。健康医疗大数据研究过程中,一旦需要跟第三方发生数据交互时,如何在尽量少分享或者不分享数据的情况下完成数据的多方联合使用并且是合规合法呢?
锘崴科技致力于数据在使用过程当中的安全保护,其独有的隐私机密计算技术可分离数据的所有权、管理权和使用权,实现数据“可用不可见”。
隐私计算技术是目前健康医疗数据研究领域正在广泛应用的一种方式。根据Gartner预测:到2025年,60%的大型组织将在分析、商业智能或云计算中使用一种或多种隐私增强的计算技术。
由于隐私计算的门槛较高,国内这方面的服务企业还比较少。王爽教授介绍说,本身隐私计算涉及到密码学、数据挖掘、系统安全等知识,医疗数据隐私计算还需要突破行业壁垒,比如:隐私计算需要引入计算噪音,但医学数据对噪音特别敏感,必须针对特定的医学场景精准建模,确保基于隐私计算构建的模型与传统数据汇总下的基于明文构建的模型是等价的。此外,针对大规模的多中心研究还要保障性能问题。
自2011年开始从事隐私计算研究,十年间王爽教授跟很多学校、药厂进行过大量合作,并发表过近百篇关于隐私计算研究的文章,也吸引了越来越多的合作方。“2018~2021年间,GDPR、CCPA、《个人信息保护法》等法规先后出台,全球数据保护热度提高,数据保护的需求力度在加大,我们把之前做过的隐私计算技术商业化,通过标准化的工具和产品提高隐私计算技术输出的能力。”他说。
安全又合法!健康医疗大数据研究解锁“新玩法”
对于健康医疗大数据研究者来说,隐私计算技术能够让数据可用不可见,让数据提供方、算法提供方、数据需求方都能合法安全的开展数据合作。王爽教授介绍说,“基于隐私计算技术,数据留在采集方手中也能给合作方使用,避免传统的数据分享过程中可能出现的违规操作和超范围使用等情况。”
哪些健康医疗大数据应用场景可以采用隐私计算呢?
近年来,锘崴科技已经参与了一系列的健康医疗大数据应用研究,通过隐私计算帮助数据研究各方在安全合规的前提下开展数据合作,举例如下:
场景1:多中心药物研究
痛点:在一些药物研究项目中,单中心的数据量是不够的,多中心的模式渐渐兴起。
过去是在药厂资助下通过一个牵头的PI(principal investigator,主要研究者)把全国的数据搜集上来,通过中心化数据库对外提供服务。
现在数据收集方在做中心化的数据收集面临很大的压力;数据提供方也担心数据交出去后被转卖或超范围使用。
多中心研究可能有十几家或者几十家医院同时参与,样本量一般在几万到十几万这个范围内。通过隐私计算或者联邦计算的模式,药物研究组织可以安全快捷地组织开展多中心研究,新加入的中心在不需要把数据给出去的前提下也可以参与多中心的联合数据分析,更有助于一些大规模项目的开展。
场景2:新突发传染病多点触发分析和预警
痛点:对于像去年底在武汉爆发的新冠肺炎这种当时还是不明原因的新发传染病,医生无法确诊就无法上报,疾控部门对疫情真实情况的掌握滞后。
锘崴参与建设“多点触发”传染病监测预警系统,赋能重大与新突发传染病关键信息技术研究,研发了基于多维度大数据的新突发传染病实时监测和早期预警系统,赋能公共卫生应急管理体系。锘崴运用隐私计算、区块链、大数据、人工智能、云计算等数字技术,在疫情监测分析、病毒溯源、防控救治、资源调配等方面提供了技术支撑。
场景3:专家之间共享数据
痛点:专家手中的数据量有限但共享有风险:“如果别人拿到数据后成功了,我的贡献不就白费了吗?”
罕见病研究、新药研发或基因数据研究等常常是多家医院的多位专家共同参与的,每家医院每位专家都有贡献。
当专家之间需要开展合作又不能直接共享其他专家的数据时,可以采用隐私计算的方式进行多方合作,数据可以追溯,每一位做出贡献的数据提供方都能有迹可循以寻求应有的回报,数据还保留在专家自己手中。
锘崴科技:隐私计算在手,健康医疗大数据无忧
“强监管并未阻碍大数据应用,相反,国内健康医疗大数据的热度越来越高。”王爽教授认为,充分学习和理解健康医疗大数据应用相关的法律规范,借助隐私计算保障健康医疗大数据安全合规的开展合作,会让越来越多健康医疗大数据研究企业和机构更有信心去抢占这篇蓝海。
锘崴科技愿意为健康医疗大数据护航!
-------------------------------------
个人简介
王爽博士是联邦学习核心理论开创学者、隐私计算领域的顶尖专家,入选国家“千人计划”青年项目。
杭州锘崴信息科技有限公司创始人。
四川大学华西医院系统遗传研究院特聘教授。曾任加州大学圣地亚哥分校教授。IEEE高级会员,国际同态加密协会创始委员,四川省生物信息学会数据共享与安全分会副会长。多项国内国际隐私计算标准发起人,拥有多项国际国内专利。目前世界上最大规模的iDASH全球隐私计算发起人,该赛事被自然杂志、GenomeWeb等媒体多次报道。
主要研究方向包含联邦学习,可信计算环境(TEE),多方安全计算,同态加密,差分隐私。他领导开发的基于安全联邦学习的跨国基因数据安全分析系统曾获得Intel杰出贡献奖。先后在国内外旗舰期刊发表著作100余篇,累计被引用3695次(2021/10 Google Scholar)。担任领域内的旗舰杂志Nature Biotechnology, Nature Communication, JAMIA等的审稿人和 PLOS Genetics客座编辑, BMC Medical Genomics 特刊主编。
曾主持或者参与数千万美金的NIH, PCORI, AHRQ项目。