博客
站在巨人的肩膀上:NLP为有效的文学景观
生命科学主任简里德博士IQVIA NLP
09年9月,2022年

大多数研究站在巨人的肩膀上建立在他人的工作,通知当前的研究和决策。然而,科学和生物医学文献的庞大且不断扩大的规模意味着它是挑战,全面评估知识的状态在一个特定的主题。在制药和保健,科学家和临床医生寻求技必威手机APP术创新,为评估提供有效的策略文学。使用自然语言处理(NLP)系统或有针对性的文学评论不是一个新奇的想法,而是越来越普遍,这种方法被广泛接受。NLP将非结构化文本文档和数据库转换成规范化、结构化数据适用于审查、分析、可视化,或机器学习模型。医药和医疗组织使用IQ必威手机APPVIA NLP(原名Linguamatics)搜索文献用例从基础研究到临床应用,为目标的发现,生物标志物,安全、临床结果、医疗事务,甚至协助病人治疗。

有三个最近的报纸,我想与你分享使用IQVIA NLP作为创新方法论的一部分,深入了解当前和历史科学在特定的主题,从现实世界中有效性数据到目标的发现。

现实世界的数据在肥胖药物剂量和临床结果

Jamieson et al (2022)从辉瑞想Apixaban周围的景观的证据使用的肥胖患者,尤其是极端的影响体重的药物动力学(PK)药效学(PD),疗效和安全性的直接口服抗凝剂(DOAC)。作者想要了解信息发布在这个主题的景观,为了更好地理解现实世界Apixaban的有效性,在肥胖患者或无相关并发症(如非瓣膜性心房颤动)。IQVIA NLP是用来搜索PubMed相关出版物、搜索策略,整合三个标准:一提到apixaban或相关的药物;某种形式的肥胖;表明在apixaban批准的标签。NLP启用这些广泛的同义词的使用,以及在药物改善疾病的关系(例如,而不是导致不良事件),在人口研究和上下文。这种方法允许作者“全面复习”可用的文学和提供一个最优的基质最后手动审查和合成。作者总结说,肥胖并不显著影响疗效,有效性或apixaban在这些病人的安全。这一结论支持美国和欧盟批准标签和强调,高体重患者的剂量调整(正如前面提出的一些共识指南)不是必需的。

发现小说制药使用NLP和机器学习的目标

汉(2022)从赛诺菲,在他们的论文中“授权的发现新目标疾病协会通过机器学习方法在开放目标平台”使用机器学习模型和集成附加数据开放目标平台,揭示新制药“目标疾病”的关联。目的是发现了强大的目标显示假设从机器学习模型。作者合成许多附加源的数据(例如基因本体论注释),并把这些新数据特性与开放目标数据的三种机器学习模型。然后他们想验证的最佳目标疾病协会从毫升模型,和,他们转向NLP,文献检索。他们从MEDLINE摘要提取的基因与疾病相关性的景观使用IQVIA NLP,查询,寻找基因制药目前没有批准的适应症,和网疾病。结果规范化、结构化输出为机器学习结果提供了有效的验证。使用这个工作流,作者产生超过1200目标显示组合支持毫升和NLP输出,有可能形成药物发现项目的基础。

评估验证研究的全基因组关联研究(GWAS)变异

我的第三个例子,Alsheikh et al (2022)从AbbVie使用综合NLP-based文本挖掘的方法和人工管理理解的实验验证,在他们最近的报告中,“GWAS验证的景观;系统评价识别309个验证非编码变异在130个人类疾病”。GWAS用于识别与特定疾病或性状相关的基因。GWAS研究整个基因组的一群人,寻找变化更多发生在与某种疾病的人比没有它的人。

GWAS已经使用了15年,作者想要的文献研究,验证在实验室发现的变化。然而,现在有一个大的研究机构在MEDLINE,作者发现/ 36 k论文相关;太多的手动审查。他们国家”,作为一个传统的关键字搜索方法不会使我们彻底搜索所有相关概念和组合,我们利用自然语言处理(NLP)和基于本体的文本挖掘,以确保系统的识别相关验证文章”。这种方法允许他们自动筛选的潜在相关论文1454篇文章的一个更合适的语料库的人工检查。从全面审查,他们发现了300多个验证GWAS变体,调节130 252个基因在人类疾病特征。这些结果支持潜在的GWAS研究疾病机制,因此翻译小说的治疗方法。

这些论文增加了身体的论文使用IQVIA NLP将非结构化文本转换为结构化输出有效的评审和决策支持。NLP使您能够处理大量的文本,使用一套工具(本体、语言模式、化学识别、正则表达式和更多),并释放丰富的科学和临床的内容。上述论文综述表明,NLP是文学研究的一个关键工具,允许用户获得一个全面和系统的观点已经出版,并达到新的结论。

NLP是用在许多不同的文本数据来源以及发表的文献,和Linguamatics后的内容库让用户容易获得一套关键生命科学的来源,所有准备text-mine,包括MEDLINE和PubMed Central, FDA药品标签,ClinicalTrials.gov,专利,预印本,基因表达综合、人类和更多。为了了解更多,看我们的内容存储网络研讨会,或与我们联系以获取更多信息。

相关解决方案

联系我们