当前位置:首页>法律法规 >相关法规>正文

谷歌旗下AI健康科技子公司DeepMind:用区块链思维打造数据追踪系统

2023-03-26 责任编辑:未填 浏览数:24 天涯医药网

核心提示:它将能连续验证我们的系统是否正常工作,并使我们的合作伙伴能够轻松地查询分类帐以检查特定类型的数据使用情况。除了在分类帐中记录每一次数据交互之外,我们还需要使用正式的方法,以及经过专家审计的代码和数据中心,以证明数据中心中的每个软件的每次数据。

我们把可验证数据审计工具看成是这种监督的一个强有力的补充,给予我们的合作医院一个额外的实时并且可以完全验证的机制,以检查我们是如何处理数据的。考虑到私人医疗数据的敏感性,以及每一次对数据的处理都应该获得授权,获得病人同意,我们认为这一方法在医疗中尤为有用。比如,一个拥有医疗数据的机构不能把用于提供医护的病人数据简单地用来进行研究,也不能未经许可重新调整研究数据库以进行使用。

换句话说:重要的不仅是数据被存储在哪,而且还包括,这些数据被用来干什么。我们希望把这一过程变得可验证、可审计的,并且是实时的。这是历史上首次。

DeepMind Health可验证的数据审计揭秘

那么,它是如何起作用的?在与医院的合作中,我们是一个数据处理器,也就是说,我们的角色是在题目的指示下,提供安全的数据服务,医院在整个过程中保有完全的控制权。现在,任何时候只要我们的系统接收或者接触到相关数据,我们就会创造一个对交流过程的日志,它可以在需要的时候被审计。

有了可验证的数据审计工具,我们将会有进一步的发展。每次与数据进行任何互动时,我们都将开始向特殊数字分类帐添加条目。该条目将记录已经使用了特定数据的事实。同样地,我们也会记录使用原因,比如,为什么血液检测的数据被输入到NHS的算法中,用于检测可能的急性肾损伤。

分类帐和其中的条目将共享区块链的一些属性,这是比特币和其他项目背后的创意。像区块链一样,分类帐将是只能加不能减的(append-only),因此一旦添加了数据使用的记录,它就不能被擦除。和区块链一样,分类帐将使第三方能够对其进行验证,所以没有人敢篡改任何条目。

但在几个重要的地方,它也不同于区块链。区块链是分散的,所以任何分类帐的验证是由广泛的参与者之间的协商一致决定的。为了防止滥用,大多数区块链要求参与者重复执行复杂的计算,相关成本相关成本非常大(根据一些估计,区块链参与者的总能量使用可以与抵得上塞浦路斯全国的电力消耗)。当涉及到医疗时,这是没有必要的,因为我们已经有可靠的机构,如医院或国家机构,可以依靠它们验证分类帐的完整性,避免像区块链一样的一些浪费。

我们还可以通过替换区块链的“链”部分,并使用树状结构来提高效率,二者的整体效果是相同的。每次我们向分类帐添加一个条目时,我们将生成一个称为“加密散列”的值。此散列进程是特殊的,因为它不仅汇总最新条目,而且还总结分类帐中的所有先前值。这使得实际上不可能有人回去并秘密地改变其中的一个条目,因为这不仅将改变该条目的哈希值(hash value),而且改变整个树的哈希值。

简单来说,你可以认为它有点像层层叠游戏的最后一步。你可以尝试轻轻地拿起或移动其中一件,但是由于整体结构,这将会造成全盘崩溃。

借助区块链机制,任何人都抹不掉数据交互记录

所以,现在我们有一个改进版的审计日志:一个完全可信的,高效的分类帐,它会捕获所有与数据的交互。它可以由一个信誉良好的第三方在医疗保健社区进行验证。那么,我们会用它来干什么?

简短的答案是:大大提高这些记录的审计方式。我们将建立一个专门的在线界面,授权我们合作医院的工作人员可以用来实时检查DeepMind Health对数据的使用情况。

它将能连续验证我们的系统是否正常工作,并使我们的合作伙伴能够轻松地查询分类帐以检查特定类型的数据使用情况。我们还希望我们的合作伙伴能够采纳自动查询功能,有效地设置警告,这样在任何异常情况下会有警报触发。而且,未来,我们甚至可以让我们的合作伙伴选择允许他人检查我们的数据处理情况,例如个别患者或患者组。

面临的技术挑战

这一项目的打造工程肯定会面临巨大的困难,但是,考虑到问题的重要性,我们认为值得为之付出。用来干什么?

现在,有三个技术的挑战最为突出:

为了证明这是值得信赖的,数据使用不可能在没有登录分类帐的情况下发生,否则,这一概念就完全没有办法成立。除了设计日志以记录与数据的任何交互的时间,性质和目的之外,我们还希望能够证明没有其他软件在后台秘密地与数据交互。

除了在分类帐中记录每一次数据交互之外,我们还需要使用正式的方法,以及经过专家审计的代码和数据中心,以证明数据中心中的每个软件的每次数据访问都由这些日志记录。

我们对确保硬件的可信赖也很感兴趣——这是计算机科学领域的一个研究热点。

1.无盲点

部署的核心将是一个接口,以允许我们的合作医院可证实、实时检查数据使用情况,我们只在经过允许的目的中使用病人数据。如果这些合作伙伴希望将这种能力扩展到其他人,例如患者或患者团体,还有复杂的设计问题需要解决。

日志条目的长列表对许多患者可能不是有用的,并且一些人可能更喜欢阅读统一视图或者依赖于可信的中介。同样,患者组可能没有权限查看识别的数据,这意味着允许我们的合作伙伴提供某种形式的系统信息,避免无意地揭示患者数据。例如,是否已经在特定数据集上运行机器学习算法。

有关我们如何提供已验证的子集的访问或数据的概要的技术详细信息,请参阅我们的开源项目Trillianproject,我们也将使用这个项目,然后这篇论文解释了其工作原理。

2.不同组,不同用法

英国还没有一个患者识别信息数据库,因此治疗过程涉及数据在医疗提供者、IT系统,甚至患者控制的服务(如可穿戴设备)之间的传输。使这些系统可协同操作需要很多工作(我们的移动产品Streams是为可协同操作标准构建的),以令它们可以一起安全地工作。这些标准也包括可审计性,以避免数据在从一个系统传递到另一个系统时造成不可复制的缺陷。

这并不意味着像DeepMind这样的数据处理器可以看到来自其他系统的数据或审计日志。日志会保持分散,就像数据本身一样。审计的可相互操作性只提供额外的保证,这些数据不会被篡改,因为它们在系统之间传播。

这是一个重大的技术挑战,但我们认为应该是可行的。具体来说,有一个被称为FHIR的新的医疗可相互操作性的开放标准,可以扩展来以可行的方式包含可审计性。

我们希望能够在今年晚些时候实现这些计划的第一部分,并计划随时在博客上发表我们的进展和我们遇到的挑战。我们知道这非常困难,而且最艰巨的挑战并不是技术上的挑战。我们希望通过分享我们的流程和公开记录我们遇到的困难,将能够与尽可能多的人合作并获得反馈,增加这种基础设施在医疗保健领域得到更广泛使用的机会。

标签:
阅读上文 >> 650万美元的斯坦福入学费 与年销50亿元的丹红注射液
阅读下文 >> 药品数据保护制度的由来与现状

版权与免责声明:

凡注明稿件来源的内容均为转载稿或由企业用户注册发布,本网转载出于传递更多信息的目的;如转载稿涉及版权问题,请作者联系我们,同时对于用户评论等信息,本网并不意味着赞同其观点或证实其内容的真实性;


本文地址:http://www.wuhanty.com/fagui/show-3694.html

转载本站原创文章请注明来源:天涯医药网

友情链接