CTcue使用伪id,以确保病人隐私。这些id病人名字替换为病人数量。一旦分配,这些数字保持不变。这种技术被称为哈希。我们使用sha - 512哈希算法。
散列值也是咸的。这使得他们更加安全,确保伪ID无法追溯到没有访问CTcue医院内的在线数据库。
此外,电子健康记录(EHR)的患者有时会合并。必威手机APP例如:患者1和病人2最初是两个截然不同的病人。然而,改变医疗输送系统后,它可能是决定P2(曾到达急诊科)实际上是一样必威手机APP的P1 (EHR)已经注册的。在这种情况下,根据CTcue,这些病人的伪IDs将合并。然后伪ID是一个散列的现有注册病人数量设置(在这个例子中,sha - 512 P1的散列)。
Pseudonymizing文本需要特别护理。删除个人资料太少,病人的隐私。删除太多,医疗信息的质量将会下降。
pseudonymize文本,我们运用两种不同的方法:第一个使用的所有信息是了解病人。第二个使用模式识别来检测未知的信息。
在数据库中,信息,如名字,姓氏,出生日期,等,将被存储为每个病人。在第一种方法中,我们使用以下信息作为输入来分析:
这些信息将被包含的整个历史。例如,如果一个病人住在多个地址,那么所有的街道的名字将被检测到。
数据
对于每个类型的数据,使用各种搜索方法。例如,首先分析名称是很重要的,如果这是一个实际的真实姓名。有时,在紧急情况下,医疗信息中输入name字段。同样重要的是要注意拼写错误或变异。例如,一个“ij”可以写为“y”或“ea”可能是不小心记录为“ae”。All these variants are replaced before we then carry out a fuzzy match on the texts. This means that words that are not an exact match but are very similar to the name will also be replaced. A further check is carried out to ensure that we do not remove a medical term.
详细联系方式
电话号码和电子邮件地址总是删除,因为都有一个模式,它可以很容易地检测到。我们也删除所有物理地址,输入作为输入,以及观察等常见变异”str上市为“街道”。
日期
出生日期和死亡在数值变异(' 1-3-67 ',' 02/03/1972 ')和在文本变体(“10月3 57”,1965年11月2日)被删除。然而,出生年份和年龄没有删除,因为这些可能是医学的重要性。
个人数字
个人数据,例如国家登记号码或保险号码删除,基于提供的输入。例如,这包括前导零的变体。我们也考虑到上下文数据。例如,如果“国家注册号码”适用或文本表明它关注保险号码,然后删除号码,即使它没有注册为输入或如果它是不正确注册。
这个过程可以确保,作为第一步,取代之前所有已知信息的方法与未知的信息,如外国地址,错误的注册信息或家庭成员的名字,可以应用。这些方法适用于已知模式和利用先前pseudonymizations发生基于输入。
病人隐私和个人数据的保护是非常重要的。Pseudonymizing数据确保遵守规则规定的通用数据保护监管(GDPR)。CTcue,我们不断改进我们的方法基于最新进展也输入来自用户和客户。