在CTcue中,笔名化是如何工作的?

avr。21, 2021

结构化数据的假名化

CTcue使用伪id来确保患者隐私。这些id将患者姓名替换为患者编号。一旦分配,这些数字就保持不变。这种技术被称为散列。我们使用SHA-512哈希算法。

散列也被“腌制”,这使得它们更加安全,确保在没有访问医院内CTcue在线数据库的情况下,永远无法追溯到伪ID。

此外,患者的电子健康记录(EHR)有时会合并。必威手机APP例如:病人1和病人2最初是两个不同的病人。然而,随着医疗保健提供系统的变化,P2(已经到达急诊科)可能已经决定实必威手机APP际上是P1(已经在电子病历中注册)。在本例中,在CTcue下,这些患者的伪id将合并。然后伪ID是集合中现有注册患者的数字的哈希值(在本例中是P1的SHA-512哈希值)。

文本的假名化

将文本化名需要特别小心。删除的个人数据太少,患者的隐私得到维护。删除过多会降低医疗信息的质量。

为了给文本取笔名,我们采用了两种不同的方法:第一种方法使用关于患者的所有已知信息。第二种是利用模式识别来检测未知信息。

在数据库中,每个病人的名字、姓氏、出生日期等信息都将被存储。对于第一种方法,我们使用以下信息作为输入来分析文本:

  • 病人的数量
  • 名字的首字母
  • 名字
  • 出生日期
  • 死亡日期
  • 国家注册号码
  • 街道名称
  • 门牌号
  • 邮政编码
  • 住所
  • 电话号码

将包括该信息的全部历史记录。例如,如果患者居住在多个地址,则将检测到所有街道名称。

数据
对于每种类型的数据,都使用了不同的搜索方法。例如,重要的是首先分析已知的名称,如果它是一个实际的真实名称。有时,在紧急情况下,会在名称字段中输入医疗信息。注意拼写错误或变体也很重要。例如,“ij”可以写成“y”,“ea”可能被意外地记录为“ae”。在我们对文本进行模糊匹配之前,所有这些变体都被替换掉了。这意味着不完全匹配但与名称非常相似的单词也将被替换。进一步的检查是为了确保我们没有删除一个医学术语。

联系方式
电话号码和电子邮件地址总是会被删除,因为它们都有一种很容易检测到的模式。我们还删除了作为输入输入的所有物理地址,并查看了许多常见的变体,例如“str”,它被列为“street”

日期
数字变体(' 1,3-67 ',' 02/03/1972 ')和文本变体(' 3 Oct 57 ', ' 2 November 1965 ')中的出生日期和死亡日期均被删除。但是,出生年份和年龄没有删除,因为这些可能具有医学意义。

个人数字
根据所提供的输入,个人号码(如国民登记号码或保险号码)将被删除。例如,这包括前导为零的变量。我们还考虑数字的上下文。例如,如果“国家注册号码”适用或文本表明它与保险号码有关,那么我们将删除该号码,即使它不是作为输入注册的或注册错误。

这一过程确保,作为第一步,在应用与未知信息(例如外国地址、错误注册的信息或家庭成员姓名)有关的方法之前,替换所有已知信息。这些方法应用于已知的模式,并利用以前基于输入的假名。

持续改进

病人的隐私和保护个人资料是非常重要的。假名数据可确保遵守《通用数据保护条例》(GDPR)规定的规则。与CTcue一起,我们根据最新的发展,并根据用户和客户的意见,不断改进我们的方法。

本文参考资料:CTcue。笔名化在CTcue中是如何工作的?

联系我们