《人类数据科学家的一天
Michael Kleinrock, IQVIA人类数据科学研究所研究开发总监b必威
博客
2019年1月23日

首先要问正确的问题

我花了大部分时间研究我的同事、客户或IQVIA研究所支持的许多不同外部利益相关者所面临的问题,因为他们优先考虑如何使用日益稀缺的医疗资源。必威手机APP但我仍然有余地退后一步,为自己的研究设定方向,研究范围广泛、初步、甚至是具有争议性的问题,而其他人还没有时间思考这些问题:

  • 在医疗体系的运作方式和实际运作方式之间是否存在差距?必威手机APP我们在哪里达到了理想?
  • 当前的热门话题是什么?争论中似乎遗漏了什么?
  • 让不同的利益相关者产生分歧的压力点在哪里?
  • 我们是否过度依赖于任何过时的研究?
  • 当我展示一项研究时,是什么让观众感到困惑或渴望了解更多细节?

在任何一年,这些问题导致多个主题的探索,这可能包括药物价格对消费的影响,解密网制造商收入,支出增长的解释司机品牌或泛型,探索新兴动力学仿生物药品,描述新药的临床益处。

尽管这类问题本身很复杂,但在我看来,一个优秀的数据科学家知道简单性在研究中的价值。尽管机器学习可能很“性感”,但它并不总是必要的。学会问正确的问题,确定正确的方法,通常意味着听到马蹄声和思考,而不是斑马。

它利用了大量的集体知识

我之所以能够梳理出我们庞大的数据集的意义,是因为我站在世界各地数千名我的前任和现在的IQVIA同事的肩膀上。我们从数十年的分析中获得了集体知识。此外,我们都说同一种语言,所以我们知道如何采访对方,了解我们所学到的东西,以保持我们的理解。这可能很简单,只要知道记录中什么时候有一个null,什么时候有一个0,以及它是被解释为数据间隙还是真正的缺失;这看起来很小,但却至关重要。IQVIA CORE集成了许多领域的专业知识、数据、技术和分析,使我们手机版必威能够不断推进工作。

好的数据科学家对他们的工作是完全透明的。他们记录下他们做了什么,为什么这么做,信息从哪里来,揭示了什么。但是,与任何文档一样,它只有与交换它的人共享的技术语言和经验一样有用。通过为更常见的分析类型开发实践领域和专门的团队,IQVIA对信息进行了编码,并创建了一个支持基础设施,使人类数据科学家能够访问和信任数据。

它考虑人类的状况

数据科学家——与人类数据科学家相反——在寻找答案时不必考虑过去的发现。他们可以使用蛮力编程来找到数据集中的相关性,并对其进行处理。

另一方面,人类数据科学家必须非常认真地考虑他们使用的数据,以及他们的发现对利益相关者(如病人和医生)的影响。有很多方法可以使用(或误用)大型医疗保健数据集。必威手机APP如果你不知道所有的细微差别,你可能会被细节所纠缠。与此同时,如果你不深入了解数据中可观察到的差异或变化的根本原因,你可能会得出错误的结论。很少有人会深入挖掘手头的证据。所有这些数据都必须得到处理,以确保隐私保护和正确的治理。我处理的是未识别的数据,但仍然坚持所有隐私原则。

在医疗保健领域,仅靠蛮力编程和相关性是没有帮助或不准确的。必威手机APP人类数据科学家花费了大量的努力来避免错误和偏见,因为我们知道风险。我们知道我们不知道什么。因此,我们利用临床专家来帮助定义市场,分析专家来避免错误的阳性和阴性,并围绕每个主要的分析和业务问题领域进行实践。

以处方产品市场需求的一个经典基准为例:处方量。当这一指标突然急剧下降的同时,媒体正在报道处方药物的高成本,许多人认为下降等同于药物成本导致的需求下降。实际上,处方量的下降是由于连锁药店配发90天供应而不是30天供应的新政策。这意味着三个月的供应被计算为一份处方,而不是三份。因此,尽管该渠道的处方量显著下降,但实际药物消耗量没有变化。

它需要灵活性

在我的工作中,我最喜欢的部分是创造新的方法,以及获得答案的多种选择。如果可能的话,应该避免只能用一种方式进行的分析,特别是当这种方法的有效性只有在最后才能知道时。理想情况下,对于每个分析,我们都建立在最佳实践的基础上。但是我们在每次迭代中都对它们进行改进。我们的方法必须既有效又可重复。

即使在IQVIA呆了20年之后,我仍然在发现新的或不熟悉的数据集。与它们一起工作的挑战是知道您是否能够自行提取所需的数据,或者是否需要与能够根据要求提取数据的专家一起工作。更复杂的去识别数据集是强大的工具,但在没有任何方向的情况下使用它们作为数据挖掘练习不太可能产生有用的结果。最优提取依赖于市场定义(其中诊断或产品代码是必要的),但它也依赖于一些预先定义的汇总数据属性,包括疾病分组。没有人愿意使用17000个ICD9或ICD10编码,但为了准确和恰当,我们必须用一套非常具体的编码来定义糖尿病、原发性高血压或黑色素瘤。即使进入我的职业生涯20年了,我知道我始终缺乏了解每个市场的正确代码的专业知识,我也不可能同时精通7种数据库编程语言或平台。

它意味着开始一段旅程

这项工作的一个挑战是,从来没有真正做过分析。这是一段旅程。即使我已经找到了答案,我也不得不把它看作是一个还没有被科学术语证明为“定律”的可行理论。如果存在相反的证据,我必须始终保持开放的心态。

这是IQVIA正在进行的“人类数据科学家的生活”系列的第一个简介。请关注更多旨在解释这一新兴学科的文章,以及它如何准备好解决医疗保健领域的最大问题并支持其最艰难的决定。必威手机APP你可以找到迈克尔·克莱恩罗克的传记在这里

你也可能感兴趣
联系我们
联系我们
联系我们

电子邮件我们

今天就联系一下,找出适合你的解决方案。

打电话给我们

我们很高兴在我们的标准营业时间与您通话。

美国免费只
+1 866 267 4479

如果打国际长途,请在我们的电话号码里找一个免费列表