关键- AI/ML结合临床知识产生了强有力的结果,比标准的流行病学方法好2.5倍,比基于科尔的规则好5倍。
挑战和注意事项-虽然AI/ML可以是一个强大的工具,可以帮助检测罕见疾病,但有一些事情需要考虑。考虑到患有罕见疾病的患者数量很低,运行AI/ML的数据集需要非常大,才能有足够的数据来开发一种算法,准确地识别患有这种疾病的患者,否则该算法有识别假阳性的风险,也就是说,确定那些没有患病的病人是否患有那种特殊的罕见疾病。其次,该算法需要对来自与用于检测罕见疾病患者的应用数据集相同的数据集的样本进行“训练”。必须使用适当的策略,以确保某些偏差不会被放大,例如,针对城市患者群体训练的算法可能不适用于非城市人群。
为了进一步完善AI/ML在罕见病检测中的应用,IQVIA测试了模式增强。互补模式增强被称为CONAN,它使用了对抗性学习的概念,在这个概念中,机器学习来区分假阳性。首先,一个发生器学会制造假的但可能是病人的样本。然后,疾病检测器试图区分阳性和阴性的病人样本。建立了发电机与疾病检测器之间的训练方法。经过培训,疾病检测器可以用于检测罕见病患者。在真实世界的数据上运行这个过程提供了强有力的结果。全文可以阅读在这里.
确定疾病流行率
AI/ML还被成功地用于确定不一定罕见的疾病的流行程度,如心血管疾病或免疫疾病。可以生成信息来进一步填补知识上的任何具体空白,使人们能够更全面地了解一种疾病。
案例研究
挑战-一位客户想了解慢性心力衰竭在加拿大人口中的流行情况,因为估计数据来自医院数据或覆盖面有限的数据库。
解决方案-IQVIA开发了一个预测分析模型,利用电子病历数据预测心力衰竭处方模式。使用大约15%的心力衰竭患者的数据集对该算法进行测试,以确定模型的准确性、正预测值和负预测值,即确定患者是否患有该疾病的可能性。然后将该算法应用于国家数据库,以估计心力衰竭的患病率。
关键-共有1515名患者参与了这项研究,以确定心力衰竭的患病率。该模型的总体准确率为80%,敏感性为65%,特异性为89%,PPV为81%,NPV为79%。当该算法应用于年龄≥40岁的患者时,本研究估计约65万例患者,与文献估计的590,416例和626,199例患者一致。
结论AI/ML的出现为数据挖掘和证据生成开辟了一个领域,以帮助解决复杂问题。IQVIA是全球领导者,凭借我们在Real World Evidence领域的专业知识,我们可以帮助我们的客户继续推动创新,最终为患者带来积极的结果。
工具书类
[1]孤儿院,“关于罕见疾病”,孤儿院加拿大,2017。[在线].
[2]“关于脐带”,加拿大罕见疾病组织,[在线][2020年查阅]。
[3]“罕见疾病诊断的全球挑战”。
[4]《数量上的罕见疾病》美国生物制药公司,[在线].