健康医疗大数据作为国家重要的基础战略资源,其应用发展正给健康医疗模式带来深刻的变化。健康医疗大数据的发展,有利于激发深化医药卫生体质改革的动力和活力,提升健康医疗服务的效率和质量,扩大资源供给,不断满足人民群众多层次,多样式的健康需求;有利于培育新的业态和经济增长点;顺应新兴技术发展趋势,规范和推动健康医疗大数据融合共享,开放应用。大数据在医疗上的应用包括:健康监测、疾病预防、临床辅助决策、互联网医疗、医药研发等方面。
健康医疗大数据时代,大量医疗数据被源源不断采集。人们往往认为,一组医疗数据把名字、身份证信息去掉后就安全了,可以公开使用。然而,当这组数据跟另一组数据连在一起时,可能会完全暴露个人隐私。如果加入基因数据,隐私安全威胁就会更明显。随着基因检测技术发展,只需大概75个统计上独立的SNP位点即可唯一确定一个人,所以说基因数据比指纹数据更敏感。当基因检测数据与一些病理数据相遇时很容易匹配到具体个人,这种确认可能会侵犯人类隐私。
数据作为一种新型生产要素,其重要性不言而喻。医疗数据涉及个人隐私、健康数据、基因信息等高度敏感信息,是国家重要的基础性战略资源。然而,想要让医疗数据真正流通起来,发挥其真正的价值,存在非常多的挑战。数据显示,在发生数据泄密事件最多的十大行业中,医疗行业居首。未经授权的泄密已经成为医疗行业数据安全的首要风险。因此,很多医疗机构出于风险控制的考量,将数据牢牢攥在手里,大量宝贵的、具有科研价值的数据被搁置。另一方面,尽管目前国内头部医学院及附属医院基本都配备了数据中心,但由于缺乏进行综合调配的高性能计算与大数据应用平台,“数据孤岛”现象普遍存在。且当前医疗数据收集往往以存证作为主要目的,数据格式、质量参差不齐,使得数据处理变得异常复杂,这些都严重限制了AI在医疗行业的应用。
数据安全与数据流通如何兼得?隐私安全计算是目前解决这个矛盾的技术最优解。首先,通过技术手段,在单个的医疗机构中建立独立的隐私安全计算数据生态,打通数据供需链条,把数据用起来。第二步,通过联邦、技术合约等方式链接多个单体平台,通过共同点协议实现联盟。平台联盟之间可以实现数据共享,通过隐私安全计算的方法在保证数据保护的前提下,进一步挖掘和获取数据价值。最终,形成数据和算法的互联网(IoDC),使数据能在被授权的情况下被所有参与者利用,在不同平台之间实现最优计算,为医疗机构获取最大化价值,促进人工智能的自驱型进步。