我花了大部分时间研究我的同事所面临的问题,客户或任何一个的许多不同的外部利益相关者IQVIA研究所支持,他们优先考虑如何使用越来越稀缺的医疗资源。必威手机APP但我仍然有纬度退后一步,把自己的研究方向广泛,初步的,甚至挑衅的问题,其他人还没有时间来思考:
在任何一年,这些问题导致多个主题的探索,这可能包括药物价格对消费的影响,解密网制造商收入,支出增长的解释司机品牌或泛型,探索新兴动力学仿生物药品,描述新药的临床益处。
尽管这些固有的复杂性的问题,一个好的数据科学家,在我看来,知道简单的价值研究。虽然机器学习可能“性感”,它并不总是必要的。有纪律提出正确的问题和确定正确的方法通常意味着聆听蹄及思考马,不是斑马。
我只能够梳理出的意义我们的庞大的数据集,因为我站在成千上万的肩膀上我的前任和现任IQVIA世界各地的同事们。在一起,我们有集体知识来自数十年的分析。此外,我们都说同样的语言,所以我们知道如何面试另一个我们学到了什么为了延续我们的理解。这可能是简单地知道什么时候有一个零和一分之十的记录,以及是否被解释为一个数据差异或真正的缺失;一个看似很小,但关键的区别。和这是内置在IQVIA核心,集专业知识、数据、技术和分析,让我们继续推手机版必威动工作向前发展。
好的数据科学家对他们的工作完全透明。他们记录他们所做的,他们为什么要这么做,信息从何而来,它显示什么。但对于任何文档,只有当有用的技术语言和经验共享交换。通过开发实践领域和专门的团队更常见类型的分析,IQVIA已经将信息和创造了一个支持基础设施,使人类的数据科学家和信任数据的访问。
数据科学家——而不是人类数据科学家——寻找答案,而不必认为过去的发现。他们可以使用蛮力编程找到在一个数据集的相关性,并就万事大吉了。
人类的数据科学家,另一方面,必须非常努力思考他们所使用的数据和他们的发现的影响利益相关者如病人和医生。有很多方法来使用和滥用,大型医疗数据集。必威手机APP如果你不知道所有的细节,你可以得到非常纠结于细节。与此同时,如果你不挖下几层理解差异的根源或变化的观测数据,可以得出错误的结论。很少人深入探究,手头的证据。和所有的数据必须正确处理,以确保隐私保护和治理。我使用non-identified数据,但仍然坚持所有隐私的原则。
蛮力单独编程和相关有用的或不准确的医疗保健。必威手机APP人类的数据科学家花费很多努力试图避免错误和偏见,因为我们知道的风险。我们知道我们不知道。所以,我们利用临床专家帮助市场定义,分析专家为了避免假阳性和阴性,与实践周边地区每个主要的分析和业务领域的问题。
举个例子,一个典型的基准市场需求的处方产品:处方量。当这个措施突然急剧下降的同时,媒体被覆盖处方药费用高,很多人认为等同于需求下降由于药物成本。在现实中,处方量的下降是由于连锁药店配药90天的供应的新政策而不是30天的供应。这意味着三个月供应算作一个处方,而不是三个。所以,尽管处方量大幅下降通道,实际的毒品消费没有改变。
我喜欢这么多的一部分在我的工作是在创造新的方法和推导一个答案有几个选项。分析只能在某种程度上——特别是当已知方法的有效性只能结束时要避免,如果可能的话。理想情况下,每个分析,我们建立最佳实践的基础上。然后我们用每个迭代改进。我们的方法必须是有效的和可重复的。
甚至在IQVIA度过了二十年之后,我仍然发现新的或不熟悉的数据集。与他们合作所面临的挑战是知道你可以提取自己需要的数据,或者如果你需要使用一个专家谁可以提取数据。更复杂的消除识别信息数据集强大的工具,但使用它们没有任何方向作为数据挖掘运动不会产生有用的结果。最优提取依赖于市场的定义(诊断或产品代码是必要的),但它也依赖于一些pre-definition总结聚合数据属性包括疾病分组。没人愿意和17000 ICD9 ICD10代码,但是为了准确和适当的,我们必须定义糖尿病、原发性高血压或黑色素瘤在一组特定的代码。甚至二十年为我的职业生涯中,我知道我将永远缺乏专业知识为每个市场,知道正确的密码,我不能七专家数据库编程语言或平台在同一时间。
这项工作是没有分析的一个挑战是真的完成了。这是一个旅程。甚至当我到达一个答案,我不得不考虑工作理论尚未被证明在科学术语“法律”。我总是打开发展中国家和共享相反证据,如果它存在。
这是第一次在一个正在进行的系列从IQVIA人类数据科学家的“生活。“观察更多的文章旨在解释这一新兴学科,以及它是如何准备解决医疗最大的问题和支持其艰难的决定。必威手机APP迈克尔让可以找到的传记在这里。