假名如何在CTCUE中起作用?

2021年4月21日

结构化数据的假名

CTCUE使用伪ID来确保患者隐私。这些ID用患者号码代替患者名称。分配后,这些数字保持固定。该技术被称为哈希。我们使用SHA-512哈希算法。

哈希也被“腌制”。这使它们更加安全,确保在不访问医院内的CTCUE在线数据库的情况下,伪ID永远无法追溯到。

此外,有时会合并患者的电子健康记录(EHR)。必威手机APP例如:患者1和患者2最初是两名不同的患者。但是,随着医疗保健提供系统的变化,可能已经确定P2(已到达急诊室的P2必威手机APP)实际上与P1(已经在EHR中注册的人)相同。在这种情况下,在CTCUE下,这些患者的伪ID将合并。然后,伪ID是该集合现有注册患者的数字的哈希(示例为p1的SHA-512哈希)。

文本的假名

假名文本需要特别关心。删除太少的个人数据,并保留患者的隐私。删除过多,医疗信息的质量将降低。

为了化学文本,我们采用两种不同的方法:第一个使用有关患者的所有信息。第二种使用模式识别来检测未知信息。

在数据库中,将为每个患者存储诸如名字,姓氏,出生日期等的信息。对于第一种方法,我们使用以下信息作为输入来分析文本:

  • 患者号码
  • 缩写
  • 出生日期
  • 死亡的日期
  • 国家注册号
  • 街道名称
  • 门牌号码
  • 邮政编码
  • 住所
  • 电话号码

这些信息的整个历史将包括在内。例如,如果患者生活在多个地址,则将检测到所有街道名称。

数据
对于每种类型的数据,使用各种搜索方法。例如,重要的是要首先分析已知名称,如果它是实际的真实名称。有时,在紧急情况下,已在名称字段中输入了医疗信息。注意拼写错误或变体也很重要。例如,可以将“ ij”写入“ y”或“ ea”可能被记录为“ AE”。在我们对文本进行模糊匹配之前,将更换所有这些变体。这意味着与名称非常相似但与名称非常相似的单词也将被替换。进行进一步的检查,以确保我们不要删除医学术语。

联系方式
电话号码和电子邮件地址总是被删除,因为两者都有一个可以轻松检测到的模式。我们还删除了所有作为输入输入的物理地址,并查看许多常见变体,例如“ streat”列出的“ str”。

日期
删除了数值变体(“ 1-3-67”,“ 02/03/1972”)和文本变体(“ 1965年11月2日”)中的出生日期和死亡日期。但是,出生年份和年龄没有被删除,因为这可能是医学上的重要性。

个人数字
根据所提供的投入,删除了个人数字,例如国家寄存器号或保险号码。这包括例如领导零的变体。我们还考虑数字的上下文。例如,如果“国家注册号”适用或表示涉及保险号码的文本,则我们删除该号码,即使该号码未注册为输入,或者是否未正确注册。

该过程确保可以应用与未知信息有关的方法,例如外国地址,错误的注册信息或家庭成员的名称,将替换所有已知信息。这些方法适用于已知模式,并利用基于输入进行的先前的假名。

连续的提高

患者隐私和个人数据保护非常重要。假名数据可确保遵守《通用数据保护法规》(GDPR)规定的规则。借助CTCUE,我们根据最新进展不断改进方法,也可以根据用户和客户的投入来改进方法。

本文的参考:ctcue。假名如何在CTCUE中起作用?

联系我们