CTcue使用伪id来确保患者隐私。这些id将患者姓名替换为患者编号。一旦分配,这些数字就保持不变。这种技术被称为散列。我们使用SHA-512哈希算法。
土豆也是“加盐”的。这使得他们更加安全,确保在不访问医院内的CTcue在线数据库的情况下,假ID永远不会被追踪到。
此外,患者的电子健康记录(EHR)有时会合并。必威手机APP例如:病人1和病人2最初是两个不同的病人。然而,随着医疗保健提供系统的变化,P2(已经到达急诊科)可能已经决定实必威手机APP际上是P1(已经在电子病历中注册)。在本例中,在CTcue下,这些患者的伪id将合并。然后伪ID是集合中现有注册患者的数字的哈希值(在本例中是P1的SHA-512哈希值)。
假名文本需要特别小心。删除的个人资料太少,会保护病人的隐私。删除过多会降低医疗信息的质量。
为了给文本起假名,我们采用了两种不同的方法:第一种方法是使用患者已知的所有信息。第二步采用模式识别技术检测未知信息。
在数据库中,每个病人的名字、姓氏、出生日期等信息都将被存储。对于第一种方法,我们使用以下信息作为输入来分析文本:
该信息的全部历史将包括在内。例如,如果一个病人住在多个地址,那么所有的街道名称都将被检测到。
数据
对于每种类型的数据,都使用了不同的搜索方法。例如,重要的是首先分析已知的名称,如果它是一个实际的真实名称。有时,在紧急情况下,会在名称字段中输入医疗信息。注意拼写错误或变体也很重要。例如,“ij”可以写成“y”,“ea”可能被意外地记录为“ae”。在我们对文本进行模糊匹配之前,所有这些变体都被替换掉了。这意味着不完全匹配但与名称非常相似的单词也将被替换。进一步的检查是为了确保我们没有删除一个医学术语。
详细联系方式
电话号码和电子邮件地址总是会被删除,因为两者都有一种很容易检测到的模式。我们还删除了作为输入输入的所有物理地址,并查看了许多常见的变体,如“str”,它被列为“street”。
日期
数字变体(' 1,3-67 ',' 02/03/1972 ')和文本变体(' 3 Oct 57 ', ' 2 November 1965 ')中的出生日期和死亡日期均被删除。但是,出生年份和年龄没有删除,因为这些可能具有医学意义。
个人数字
根据所提供的输入,个人号码(如国民登记号码或保险号码)将被删除。例如,这包括前导为零的变量。我们还考虑数字的上下文。例如,如果“国家注册号码”适用或文本表明它与保险号码有关,那么我们将删除该号码,即使它不是作为输入注册的或注册错误。
这一过程确保,作为第一步,所有已知信息都被替换,然后才能应用与未知信息相关的方法,如外国地址、错误注册的信息或家庭成员的姓名。这些方法适用于已知的模式,并利用之前基于输入发生的假名。
病人的隐私和保护个人资料是非常重要的。假名数据可确保遵守《通用数据保护条例》(GDPR)规定的规则。与CTcue一起,我们根据最新的发展,并根据用户和客户的意见,不断改进我们的方法。
本文参考资料:CTcue。在CTcue中,笔名化是如何工作的?