博客
生命科学的肮脏的小秘密
容易出错的数据库得到的AI IM创新驱动吗?
弗朗西斯卡德安杰洛,导演,全球信息管理提供,IQVIA
2020年10月22日

生命科学专业人士想要人工智能(AI)工具和他们现在需要它们。

在我们最近的调查300生命科学IM专业人士,91%的受访者称他们想要大幅增加其使用的人工智能(AI)在所有数据管理活动”。像几乎所有其他行业一样,这些生命科学专业人士的承诺吸引了预测分析和自动化数据管理。他们兴奋的是正确的。

但调查也显示出,只有40%是“非常满意”与当前人工智能特性的即时通讯解决方案。

AI工具有可能转换为生命科学企业信息管理。机器学习算法(AI)的核心部分可以学会做各种信息管理任务,包括源文件从一种语言翻译到另一个地方,解释非结构化的叙述,并根据复发预测和建议活动模式(例如,下一个最好的调用)。

但这些不是即插即用的解决方案,可以部署在一夜之间神奇地解决你所有的数据管理问题。机器学习算法需要符合行业的特异性,然后被训练去做这些任务,这需要时间,分析和市场专业知识,学习很多干净的数据。更大的和更一致的这些数据集,算法的结果越精确。

这是人工智能方面,商界领袖往往不完全理解,这可能会导致沮丧。尽管91%的受访者称他们想要使用AI,只有60%的人愿意这么做。机器学习,另有46%的人认为是他们最希望的服务——但不要觉得他们可以找到在当前的产品。

这表明他们认识到机器学习算法需要让他们的AI梦想成真,但供应商没有满足他们的期望。

机器人与算法

问题的一部分是,通常会有不匹配的想法AI可能做什么,目前的人工智能解决方案可以提供。大部分的功能目前仍然依靠传统的基于规则的自动化,而不是完整的机器学习解决方案。这些基于规则的机器人可以用于自动化手动任务,但他们不够聪明解读数据意味着什么,或者确定是否需要人类关注的东西。

一些供应商有更复杂的解决方案,而是因为他们常常来自纯技术公司而不是生命科学集中的公司,他们可能缺乏行业专业知识理解的最佳用例人工智能工具。这可能导致算法不收集正确的数据,或者使用数据的方式不结合监管要求,将用户违规行为的风险。

脏数据困境

然而,最大的一个,至少讨论,障碍有效的人工智能驱动的分析是数据本身。许多公司使用的内部数据库训练算法是混乱的,非结构化的,充满了错误。拼写错误,复制数据,缺少字段,和不一致的报道策略导致“脏数据”,阻碍了这些工具的有效性能。

这不仅仅是一个生命科学的问题。一个益百利研究发现美国各行业组织相信32%的数据是不准确的;和91%的受访者认为他们的收入是负面影响不准确的数据。

脏数据不是一个有意的问题。它发生在幕后当公司合并数据库,依靠工作流不一致,未能建立合适的报告规则,维护保持清洁和一致的数据。例如,当名字拼写不验证,标题是不一致的记录,和缺少的数据将被忽略,问题堆积起来。

不管什么原因,直到数据清洗,再多的算法训练将生成准确的结果。幸运的是,公司可以使用人工智能和机器学习算法解决这个问题——如果他们能找到合适的供应商,帮助他们这么做。

在短期内,这种信息管理供应商访问大型全球医疗数据集可以为客户提供大量的干净数据来训练他们的算法,消除了需要依靠自己的较小和较一致的数据库对这些项目。必威手机APP这产生更快和更可靠的结果从早期人工智能和机器学习的部署。它也可以帮助企业领导人证明这些工具支持的价值进一步投资在人工智能的创新。

从长远来看,算法可以用来清理脏数据,帮助企业重置基线数据一致性。通过正确的训练,算法可以学会发现和消除重复,比较名字拼写,填写缺失或不准确的数据,并标记慢性错误进行人工干预。对于任何机器学习项目,清理数据库需要时间,但它所有将来的数据驱动的工作奠定了基础。

如果你想确保你的组织准备根据AI-driven做出商业决策分析,你想成为知己,数据是干净的、一致的和准确的。

不会过时的人工智能策略

仍然有很多的炒作在信息管理领域,所以生命科学公司应该明智地选择自己的供应商。这些投资将有实战经验的理想合作伙伴在生命科学行业,大型多样化的全球数据集,生命科学和经验构建算法在特定的用例。他们还应该能够提供长期技术演示计划发展他们的人工智能产品,满足生命科学领域客户的需求。

生命科学产业仍处于初期阶段,为生命科学、人工智能和机器学习的潜在影响是显著的。这些工具承诺提供的见解,开车时间和节约成本,加快药物开发,加强betway必威怎么提款有针对性的销售和营销策略更好的结果的结果。今天选择正确的合作伙伴和投资时间创建清洁和一致的数据的最佳方法是加速进化和建立一个强大的人工智能驱动未来的基础。

有关更多信息,请联系您的客户经理或IQVIA.com/Information管理

联系我们