使用新方法解决罕见疾病奥秘链接个人记录,同时保护隐私
麦格理大学的研究人员已经证明了一种新的方式连接的个人记录和保护隐私。第一个应用程序是确定病例罕见的遗传疾病。还有许多其他潜在的应用在社会。
研究将于18日ACM亚洲计算机和通信安全会议上7月12日在墨尔本。
一个五岁的男孩在美国有一个突变的基因称为GPX4,他只有10世界上其他孩子。条件会导致骨骼和中枢神经系统异常。还有其他可能患有注意力缺陷多动症的儿童全球数以百计的健康记录和诊断数据库,但是我们不知道,因为他们的隐私保护法律和商业原因。
但如果记录与能找到条件和计算,同时仍然保留隐私?澳大利亚麦考瑞大学网络安全中心的研究人员已经开发出一种技术来实现。教授和博士的团队包括Dinusha Vatsalan大理Kaafar计算和大学的男孩的父亲,软件工程师Sanath Kumar拉梅什先生,谁是OpenTreatments基金会的首席执行官在西雅图,华盛顿。
“我对这项工作很兴奋,拉梅什先生说,他的基金会发起和支持这个项目。“知道有多少人一个条件支撑经济的假设。如果一个条件以前认为15例,现在我们知道,有了数据从诊断测试公司,有100名患者,增加市场规模巨大。”
“这将产生重大的经济影响。公司的估值工作条件会涨。产品成本会下降。保险公司占医疗费用将如何变化。诊断公司将目标(条件)。你可以开始做流行病学更准确。”
链接和计数数据记录可能看起来简单,但实际上,它涉及到许多问题,Kaafar教授说。首先,因为我们正在处理罕见的疾病没有集中的数据库,记录被洒在世界各地。“数以百计的数据库,在这种情况下,”他说。”,从业务的角度来看,数据是宝贵的,和公司持有它不一定感兴趣的分享。”
然后,有技术问题匹配的数据记录、编码和存储在不同的方式,和占个人重复计算和不同数据库。最重要的是,隐私方面的考虑。“我们正在处理非常非常敏感的健康数据,“Kaafar教授说。
这个人资料不需要一个简单的估计病人的数量和流行病学的目的。但是,直到现在,需要确保记录是独一无二的,可以联系。
Vatsalan博士和她的同事们使用一种称为布隆过滤器的技术编码与微分隐私。他们故意设计了一套算法,介绍了足够的噪声数据模糊精确的细节,我们无法从个人记录,但它仍然允许记录相同的疾病状态的模式匹配和集群。
他们的技术被评估的准确性使用北卡罗来纳州选民登记数据。,结果显示该方法导致了微不足道的出错率,保证一个非常高水平的隐私,即使是在高度的数据集。技术明显优于现有方法。
除了检测和计数罕见疾病研究有很多其他应用程序;确定新产品营销的意识,例如,或在网络安全跟踪数量的特定社会媒体文章的独特风貌。
但它是应用程序的罕见疾病麦格理大学的研究者们充满激情。“没有比这更好的感觉比他们已经看到了技术研究发展中产生真正的影响,让世界变得更美好,”Kaafar教授说。“在这种情况下,它是如此真实,如此重要。”
“想让这个项目完全的基础开源从一开始,”Vatsalan博士补充道。“所以我们实现的算法是公开发表。”
更多信息:南吴et al,保护隐私记录链接为基数计算,诉讼的ACM亚洲计算机和通信安全会议上(2023)。DOI: 10.1145/3579856.3590338