“我们正在构建的能力,不仅让我们能够使用大数据,而且能够有效地从有限数据中提取新的见解。您可以使用不同的方法来增强数据......并基本上构建创新的方法来从您可访问的全部信息范围内提取组合见解。”
Bülent Kızıltan
诺华 AI 创新中心因果推断与预测分析负责人
Bülent Kızıltan 博士是全球最大的制药公司之一诺华的因果推断与预测分析创新负责人。在 AI 创新中心,Bülent 负责与学术界和行业合作伙伴共同推动 AI 领域的发展,帮助更快地将新药推向市场。
在本期节目中,您将了解如何利用数据科学引领创新,并使用新的 AI 方法加快创新速度,这些方法有助于将大数据结合起来,从有限信息中提取见解。Kızıltan 博士分享了有效管理大量数据和组件以推动业务增长的策略。我们还将探讨公司如何减轻偏见、评估道德和吸引多元人才。
Kızıltan 博士拥有天体物理学博士学位,专注于应用数学,拥有两个天文学和天体物理学理学硕士学位,专注于统计学。他因其在哈佛大学的领导力、指导和教学而获得众多荣誉和奖项。他目前担任哈佛商业评论和麻省理工科技评论的咨询委员会成员。
诺华 - Bulent
迈克尔·克里格斯曼:我们正在与 Bülent Kiziltan 谈话,他是诺华 AI 创新实验室的因果推断与预测分析负责人。他们是一家大型公司。这将是一场关于数据驱动的药物发现和开发的引人入胜的对话。Bülent,你好吗?很高兴见到你。
BÜLENT KIZILTAN:迈克尔,见到你也很高兴。谢谢。你怎么样?
迈克尔·克里格斯曼:我很好。Bülent,告诉我们关于诺华的信息,并告诉我们关于 AI 创新实验室的信息。
BÜLENT KIZILTAN:诺华是一家美瑞士跨国公司。全球最大的制药公司之一,拥有超过 100,000 名员工。AI 创新实验室是最近创建的,现在已经有一年多了。该公司几年前就制定了将诺华转型为数据科学公司的远见卓识的路线图。在这种情况下,诺华明白我们需要真正推动 AI 创新领域。
我们知道,只有战略性地将学术界、技术界和制药界同时交叉,才能站在 AI 创新的前沿。从更广泛的制药和生物技术领域来看,使用标准的传统数据科学操作是不可能的。因此,AI 创新实验室的战略定位是交叉不同的学科,与学术界建立联系。基本上,利用该领域正在创造的专业知识。
并与领先机构和该领域的先驱者在该领域共同开发、共同创新。此外,还与微软研究院等科技巨头合作,将该技术真正引入运营。然后,还跨越学科界限和内部业务部门,以推动诺华的效益。
迈克尔·克里格斯曼:Bülent,你是 AI 创新实验室的因果推断与预测分析负责人。那么,这个职位包含什么?
BÜLENT KIZILTAN:在创新实验室,我们有三个支柱。其中一个是专注于图像分析和可视化,由我的同事领导。另一个支柱是 NLP,它也非常具体地针对自然语言处理。我们在 AI 数据科学和机器学习意义上的所有其他工作以及高级统计分析都属于我团队的职责范围。除了我们进行的传统数据科学外,我们还在因果推断、因果发现领域构建能力。
迈克尔·克里格斯曼:我们正在讨论数据。因此,当您讨论因果关系和推断时,这意味着数据。那么,数据如何在药物发现过程中发挥作用?
BÜLENT KIZILTAN:数据已经成为我们决策过程,药物发现和开发过程的核心。因此,虽然我们几年前决定改变内部文化,并为诺华制定成为数据科学公司的路线图,但我们的意思是,我们如何确保能够更有效地利用数据,并确保我们的决策由数据驱动?
这对药物发现、药物开发以及我们在诺华内部进行的所有其他工作都是有效的。具体到药物发现领域,诺华生物学研究所已经拥有大量数据。近 20 PB 的数据,其中包括图像、扫描、化学信息和化合物库,包含近 200 万种化合物的相关信息。
因此,我们如何真正将所有这些信息结合起来,并确保整个发现和开发过程,这个过程痛苦地需要数年时间、数十亿美元,我们如何才能使它更有效、更短?并确保我们不必在实验室里做所有事情,我们可以在计算机上完成,即通过计算建模。
这就是我们前进的方向。数据在整个过程中起着至关重要的作用。数据科学和 AI 创新的目标是加快这一过程,并利用以前无法有效利用的信息领域。
迈克尔·克里格斯曼:因此,从根本上说,与过去相比,使用计算方法而不是实验室方法是不同的。
BÜLENT KIZILTAN:我会说,除了这些,我们基本上是在增强整个过程。此外,有时我们可以模拟信息和数据,这些信息和数据可以用来添加到实验室创建的信息证据中。因此,我们基本上是在合作,替换实验室产生的实验室数据。此外,我们还在构建能够帮助我们有效地将来自我们称为不同模态的信息结合起来的能力。
例如,如果我们有图像,如果我们有化学化合物,传统分析和组合方法是分别在这些两种不同模态下进行分析。而使用来自数据科学领域的新方法和创新方法,我们可以有效地更有效地将这些信息结合起来,以提取新的见解。
迈克尔·克里格斯曼:那么,数据的作用正在改变,还是......(我会说“仅仅”)收集不同类型的数据?因此,与过去相比,数据的使用从根本上发生了变化吗?
BÜLENT KIZILTAN:我会说它正在不断发展,并且处于不断发展的道路上。我们如何真正使用数据,创建数据和记录数据。这就是为什么整个数据科学领域是跨学科的。我们需要与技术领域中的合作伙伴协同工作。
此外,与学者合作,将他们在这个领域构建的最先进的专业知识引入进来。并将这些有效地结合起来,从而得出新的见解,提出新的组合方法。但是,我们一直在探索生成新类型数据的方法,以增强整个过程。
迈克尔·克里格斯曼:你处理多少数据?
BÜLENT KIZILTAN:这取决于用例。有时数据非常有限,有时我们处理的数据量从 TB 到 PB 不等。但实际上,这取决于用例,是哪个领域,哪个疾病领域,我们正在研究的哪种特定药物。在医疗保健领域,我们需要构建能够从少量有限数据以及大数据中提取信息的能力。
从某种意义上说,这是信息的整个范围,即我们处理的数据类型和数据量。创新的未来不仅在于大数据,而且我们还需要能够有效地从少量数据中提取信息。所以这真的取决于。
迈克尔·克里格斯曼:当谈到机器学习等活动时,我们确实倾向于认为是大量数据,但你也在非常密切地与稀疏数据合作,在那里你没有那么多数据,但你仍然需要推动和得出某些重要类型的结论。
BÜLENT KIZILTAN:没错,迈克尔。特别是在医疗保健领域,我们往往受到可以为特定用例收集的信息量的限制。我们不能只是在真空中构建方法,然后尝试将其应用于不同的用例或问题集。
因此,我们在数据科学和 AI 领域不断发展,方法和创新前沿不仅仅由方法驱动,而是由可用数据的类型驱动。这就是为什么我们 AI 创新中心团队正在构建的能力,不仅让我们能够使用大数据,如果可以这么说,而且能够有效地从有限数据中提取新的见解。
您可以使用不同的方法来增强数据,也可以使用一些非常成熟的应用数学方法来组合这些信息,并基本上构建创新的方法来从您能够访问的所有信息中提取组合的洞察力。
MICHAEL KRIGSMAN: 您能给我们一些关于您查看的数据类型或制药行业中普遍使用的数据的背景吗?
BÜLENT KIZILTAN: 是的,这些信息可以来自药物发现领域的化合物库。它来自网络实验室。它来自有时公开的患者记录。有图像。有时还有在整个过程中记录的视频。
所以,我们可以获得的任何信息,取决于用例,可能会有很大差异。有基因组信息。有验血。我们可以利用的实验室分析。我们还使用大量公开可用的数据来增强整个内部预测过程。
MICHAEL KRIGSMAN: 所以您正在收集来自诺华内部以及各种不同类型外部参考来源的这一非常广泛的数据范围。在您进行分析时,所有这些都将用于药物发现和开发过程。
BÜLENT KIZILTAN: 没错。诺华处于一个非常独特的位置,在过去二十年里,记录了超过 200 万名患者年的数据,这些数据可在内部供我们的数据科学家和生物学家访问。
除了诺华生物研究所创建和采购的数据外,该研究所可以访问化学数据、图像和生物学——尤其是生物学,我们正在引入的数据量。此外,我们还利用公开可用的数据来增强整个预测过程。
MICHAEL KRIGSMAN: 为了管理所有这些不同类型的数据,需要建立什么样的基础设施?同样,无论是在诺华还是在整个行业内部。
BÜLENT KIZILTAN: 使数据可访问并防止数据科学家将大部分时间花在数据整理和数据管理上,我认为这是每个大型制药公司的主要目标之一,因为存在大量法规。
因此,公司一直在投资数十亿美元来构建能够使数据在内部流动起来的基础设施,这意味着可以直接访问和准备分析。因此,数据科学家可以使用创新的技术和架构,与领域专家合作,为整个过程产生更多见解。
MICHAEL KRIGSMAN: 这通常是 IT 功能吗?还是谁负责构建该基础设施?同样,只是整个行业的普遍情况。
BÜLENT KIZILTAN: 是的,IT 绝对是整个过程中的主要参与者和合作伙伴。但是,取决于公司自身的策略、优先事项和资源,它属于哪个业务部门和功能可能真的取决于情况。我们有一个专门的数据和 AI 功能部门,我们与 IT 非常密切地合作。我们进行跨职能工作,以便构建并使该基础设施真正可供所有数据科学家使用。
MICHAEL KRIGSMAN: 云和本地如何?在您收集、整理、使用和解释数据的过程中,云和本地是否发挥作用?
BÜLENT KIZILTAN: 是的,这是我们的技术界合作伙伴正在解决的问题。当然,我们有一个主要合作伙伴,即微软研究院和人工智能创新实验室。我们正在与他们合作,并使用他们的云基础设施来构建我们的数据管道。但我们也有内部基础设施,这将使我们能够进行快速的探索性研究,但也能够扩展规模。因此,我们基本上是在两方面进行投资。
MICHAEL KRIGSMAN: 是的,两方面都意味着云和本地。
BÜLENT KIZILTAN: 内部基础设施,是的。
MICHAEL KRIGSMAN: Bülent,对于这种类型的药物发现和开发,实时数据是否发挥作用?
BÜLENT KIZILTAN: 因此,我们绝对会大量使用所谓纵向数据,即在不同时间记录的数据。但这些数据主要是在记录后,然后我们对这些数据进行回顾性分析。因此,我们不进行实时分析。但其他功能部门也配备了基础设施,在这些功能部门,实时数据可能很重要。
MICHAEL KRIGSMAN: 您能举一个实时数据可能很重要的例子吗?我之所以问,是因为人们会认为,在药物发现中,您收集了这些数据,然后在收集完这些数据后对其进行分析,然后对其进行解释,最后得出某种结论。这不是我们通常对实时数据的看法。
BÜLENT KIZILTAN: 没错,所以在药物发现和开发领域,我想说我所接触的所有数据都是记录下来的,但数据具有时间方面,这在分析中起着非常重要的作用。但在内部,有些功能可能与市场分析有关,这些功能可能需要利用实时数据来进行潜在分析和预测。这可能使用一些实时数据,但我个人没有处理过这些类型的数据。
MICHAEL KRIGSMAN: 显然,这与药物发现和开发本身的过程不同。
BÜLENT KIZILTAN: 没错。所以在药物发现和开发领域,这些过程通常会持续很长时间。人工智能和数据科学的目标之一是缩短这一过程。因此,大部分数据都在被记录,但它们具有我们真正利用并用于分析的时间方面。
MICHAEL KRIGSMAN: 所以真正重要的目标是缩短纵向时间,以便更快地得出结论并将药物更快地推向市场。
BÜLENT KIZILTAN: 没错。成本会随着特定药物开发和发现过程所花费的时间线性增加。之所以可能花费很长时间,至少其中一个方面是生成证据并将队列和患者纳入研究。
利用机器学习数据科学,我们可以通过使用我们正在开发的一些方法来创建更多证据,从而缩短这一时间,而且还可以针对特定患者和队列,这些患者和队列更适合特定研究。因此,机器学习绝对有助于缩短研究时间线,同时降低药物开发和发现成本。
MICHAEL KRIGSMAN: 您是否知道是否进行过关于机器学习有效性的研究,以缩短将药物推向市场的时间?
BÜLENT KIZILTAN: 是的,整个过程,从药物发现到开发,是一个非常漫长的过程,包含多个活动部件。机器学习目前在大多数活动部件中发挥作用,并且有可能对其他剩余的活动部件产生重大而积极的影响。因此,我们正在研究并积极投资于构建能力,以增强整个流程中有助于这一过程的每个活动部件。
MICHAEL KRIGSMAN: 您所面临的一些数据挑战是什么?无论是收集高质量数据、一致数据,还是您遇到的任何其他问题,或者整个行业在收集所有这些各种类型数据时遇到的任何其他问题。
BÜLENT KIZILTAN: 正如您已经提到的那样,迈克尔机器学习,特别是标准方法依赖于所收集数据的数量。数据越多越好。在医疗保健领域和生物技术领域,数据量是一个持续存在的问题,因为收集数据并将其清理到足以供数据科学家使用,需要很长时间。
而且,由于严格的监管,访问不同业务部门的数据可能具有挑战性。因此,您提到的所有内容,获取干净的数据,获取我们产生证据所需的数据量,以及访问与基础设施投资相关的数据,都是整个过程的重要方面。
MICHAEL KRIGSMAN: 您是否面临着与进行传统实验室工作的人员不同的数据挑战?
BÜLENT KIZILTAN: 我会说既是也不是。当我们基本上进行数据收集时,我们会面临一些不同的挑战,这些数据来自不同的实验室,来自外部供应商,也来自内部临床试验,挑战在于真正组合来自不同来源的信息。
内部偏差可能非常不同。噪音可能非常不同。而在实验室中,管道可能非常同质,即使它可能是存在偏差的。但一旦他们确定了这种特定偏差,就可以立即解决。而当我们使用多个数据源时,潜在的问题和偏差可能会更加复杂。
MICHAEL KRIGSMAN: 在实验室中,显然这是一个更受控的环境,而您所接受的是所有来者,可以这么说。
BÜLENT KIZILTAN: 没错。因此,正如您所说,所以实验室中可以控制某些事情,但这对于实验室人员来说仍然是一个痛苦的过程,他们必须手动完成某些事情。
而我们正在尝试尽可能自动化该过程,我们基本上利用了可以半监督(如他们所说)、无监督或自监督的方法。因此,我们在构建方法时逐渐增加了复杂程度,但我们采取了渐进式步骤,我认为这在整个过程中非常重要。
MICHAEL KRIGSMAN: 您提到了偏差。当您处理这些大型数据集时,如何确保偏差程度降至最低?
BÜLENT KIZILTAN: 这是一个非常好的问题。该领域正在积极投资于构建明确的策略,以解决数据收集和分析中的偏差问题。所以我们可以谈论两种类型的偏差。其中之一是数据固有的,我们可以通过安慰剂组进行测试。
或者,如果我们有一组额外的我们可以比较的数据,我们可以使用我们正在处理的数据,我们可以想出一个指标,可以让我们了解数据内容或数据本身存在哪种类型的偏差。然后,我们还有一些偏差可能来自我们正在应用的方法。
而且,我们也已到位了一些方法,我们可以使用它们来有效地衡量可能存在哪些类型的偏差。所以在这里,不确定性预测在理解我们正在预测的内容方面起着至关重要的作用。这在数据科学领域是一个不断发展和动态发展的领域。
MICHAEL KRIGSMAN: 看起来偏差问题既来自固有偏差的角度,也来自过程的角度,这听起来对您的团队和整个行业来说都是非常重要的问题。
BÜLENT KIZILTAN: 非常正确,这在医疗保健和生物技术领域尤为重要,因为我们根据模型做出的决定会影响患者的生活。因此,我们正在投资于真正识别这些偏差,并努力想出定义我们的管道和流程的道德方式。
MICHAEL KRIGSMAN: 伦理问题也是一个非常棘手的问题。
BÜLENT KIZILTAN: 没错。
MICHAEL KRIGSMAN: 您想详细说明伦理方面为什么具有挑战性吗?
BÜLENT KIZILTAN: 是的,因此人工智能和伦理以及人工智能的其他领域一直在发展。但它没有像其他领域那样快速发展的原因之一是,我们没有来自社会科学界的投资和合作,他们加入并与工程师和科学家一起解决这个问题。
我们已经看到这种合作关系在不断发展和成熟,但我们仍然需要找到与社会科学和学术界以及其他能够真正为整个努力做出贡献的参与者交汇的方式。 这不仅是一个技术问题,而且还涉及到真正触及我们所做工作的技术方面的主题。
但这与社会科学和理解社会、技术以及长期影响有关。 因此,这是一个真正的跨学科领域,这种合作没有像人工智能的技术方面那样迅速发展。
迈克尔·克里格斯曼:当然,当涉及到公平获得医疗保健资源、研究的疾病类型、成本等等问题时,医疗保健与几乎所有其他领域都非常不同,原因很明显。 没错,因为如果我病了,我不在乎它要花多少钱。 但与此同时,我不想让我的健康保险上涨。 所以很明显,社会方面非常复杂,不用说。
布伦特·基齐尔坦:迈克尔,确实如此。 医疗保健生物技术制药是一个非常复杂的领域。 有多个合作伙伴必须积极参与讨论,以及我们正在前沿推动的方法的发展。
我们不能只由学术界驱动。 我们不能只由技术驱动。 我们肯定必须与来自不同学科的领域专家有效地合作。 这是一个真正的跨学科领域,可能有时非常困难,但值得投资,而且令人兴奋。
迈克尔·克里格斯曼:告诉我们你的团队构成。 你已经多次提到这个跨学科方面,那么你的团队如何反映这种重点呢?
布伦特·基齐尔坦:由于数据科学和人工智能是高度跨学科的,我们一直在专注于吸引人才,他们可以将他们的多元化背景融入我们的运营和管道,并做出贡献。 因此,我们吸引了来自不同领域的人才,从物理学、数学、生物信息学、化学,你想到的都有。 我们甚至有具有社会科学背景的人,他们在其之上建立了一些分析技能,他们正在为我们正在进行的工作做出贡献。
迈克尔·克里格斯曼:所以你将来自不同多元化背景的人聚集在一起。
布伦特·基齐尔坦:没错。 在数据科学中,很重要的一点是,我们不能只关注他们带来的能力。 主要是因为能力,如果得不到培养,它们可能会在六到九个月内过时。
因此,我们希望吸引真正会学习、适应、真正跨学科且好奇的人才。 这就是为什么当我出去与我的同行和同事交谈时,除了他们带来的能力之外,我还想关注好奇心和学习潜力。
迈克尔·克里格斯曼:所以这不仅仅是拥有科学背景的问题,他们还需要正确的心态和文化。
布伦特·基齐尔坦:绝对没错。 有了学习我们所做的工作的技术方面的潜力,我们所做的工作非常技术化,我认为心态在数据科学和人工智能领域取得成功中起着举足轻重的作用。
迈克尔·克里格斯曼:所以他们需要正确的技术能力,正确的技术技能来管理和处理你解决的问题,以及这种文化和心态观点。 作为基线,他们至少必须具备哪些核心技术技能?
布伦特·基齐尔坦:当然,对我们所做的工作的数学、机器学习和计算方面的良好理解,是我们寻找的最低限度的技术能力。 但除了这些,我们还想吸引能学习、适应不断变化的环境的人才。
能够快速获取数据和信息并执行,因为今天相关的知识可能在六到九个月内就会过时,正如我刚才提到的。 因此,除了数学和计算的核心能力外,我们正在寻找能够在短时间内适应、学习和执行的人才。
迈克尔·克里格斯曼:因此,这种适应性是关键,因为药物发现和开发正在以非常快的速度发展。
布伦特·基齐尔坦:没错。 数据科学,尤其是在药物发现之上,发展得更快。 因此,当我们坐在房间里时,我们经常会感觉自己对生物学或化学领域讨论的话题一无所知。
我当然来自天体物理学背景,但我们需要能够有效地交互、获取和理解来自领域专家的信息。 并将其实施,并将其整合到我们正在开发的方法中。 因此,我认为,如果你想在未来取得成功,真正理解信息、消化信息并将其应用到你的工作中至关重要。
迈克尔·克里格斯曼:这很有趣。 所以你拥有你的领域专业知识,但你也在从生物制药以外的其他领域获取数据、能力、技能、技术、分析技能、能力和技术。
布伦特·基齐尔坦:没错。 因此,我们的方法和技术路线图应由我们可用的信息驱动。 主要的是,它应该是数据驱动的,但如果我们没有有效地与领域专家交互,我们基本上是盲目的。 如果我们不使用这些领域信息,我们将纯粹是经验主义者。 这在构建一个全面的机制方面也起着至关重的作用,它将为我们解决的任何问题提供额外的见解。
迈克尔·克里格斯曼:所以,不是说在诺华公司特别如此,但数据显然非常特定于领域,但分析技术可能来自其他领域,这样说对吗?
布伦特·基齐尔坦:绝对没错。 这就是创新前沿所在。 事实上,我使用过在天体物理学领域开发的一些技术,将应用数学应用于新的问题集。 这是创新的两种方式之一。 创新的一种方式是构建和开发新的方法,但创新的另一种方式是将先进的方法应用于新的问题。 这正是我们所做的。
迈克尔·克里格斯曼:有趣。 所以创新可以来自你收集数据的方式、数据类型以及你收集数据的来源。 但创新也可以来自你用来对这组数据进行操作的分析技术。
布伦特·基齐尔坦:是的,第二个绝对正确。 我们可以使用在不同领域开发的方法,将其应用于新的问题集。 我们也正在与领先的机构和先驱合作,共同开发和创新以前不存在的全新方法。 然后,我们可以将其应用于标准问题,以及新问题。
迈克尔·克里格斯曼:布伦特,好的。 所以你正在与一群非常聪明的人打交道,在许多情况下是行业领先的人。 无论是你的合作伙伴学术机构,还是来自不同背景的人,他们都在你的团队中工作。 所以我的问题是一个非常基本的问题,那就是,你怎么让他们不互相残杀?
布伦特·基齐尔坦:这是一个好问题。 吸引具有多元化背景的人才,肯定有其优缺点。 当然,将这种多元化的背景和见解汇集到一个特定问题中,非常非常有价值。 但这也带来了具有不同文化背景的不同性格。
他们处理信息的方式、交流的方式可能非常特定于领域。 这给领导者带来了挑战,他们必须真正运用自己的领导技能来建立一个能够作为一个团队运作、能够作为一个团队执行的有效团队,这肯定是一个挑战。 在全球研究中,我们看到的两个决定数据科学运营成败的关键因素实际上不是技术能力。
其中一个是领导类型,另一个是文化。 它们在决定数据科学运营是否能够在中期和长期取得成功方面密切相关。 当然,我一直在提倡并在公开演讲中告诉学生的是,除了技术技能外,一定要投资于你的软技能。
因为这不仅对你的内部团队非常重要,而且当你与来自不同学科的领域专家进行交互时也非常重要。 因为每个人沟通的方式都不同,建立有效的沟通渠道是首要的,以便理解问题所在,然后我们将在其基础上构建解决方案。
迈克尔·克里格斯曼:我不得不假设,除了你如此雄辩地描述的沟通之外,明确结果也必须牢记在心,以及作为使团队协调一致并使每个人朝着同一方向努力,以实现相同或共同目标的手段。
布伦特·基齐尔坦:绝对没错。 以结果为中心非常重要,但数据科学也具有探索性。 有时,它会对整个过程造成很大的限制。 它可能使事情变得不明朗。
因此,领导者有责任澄清这个过程,并建立一个考虑到整个过程探索性的路线图。 当然,我们需要探索。 我们不能总是从一开始就确定某些结果。 我们需要能够适应传入的信息,并相应地构建风险。
迈克尔·克里格斯曼:这很难。 管理这种研发非常困难,因为你正在处理许多未知因素。
布伦特·基齐尔坦:没错。 所以在数据科学运营中,我们在这个领域看到的主要是由业务部门驱动的结果。 这不是创新发生的地方,但另一方面,大多数数据科学运营都是研发驱动的,有很多探索。
我们对创新的观点和方法是在研发和现实世界执行之间找到战略平衡。 当然,这将成为一种由公司的优先事项和资源驱动的平衡。
迈克尔·克里格斯曼:布伦特,鉴于所有这些,你对人工智能领导者或一般企业领导者,管理人工智能团队,以及在他们自己的组织内部变得更有效,处理大量数据,甚至处理你之前描述的稀疏数据问题,有什么建议吗?
布伦特·基齐尔坦:数据科学和人工智能的价值主张不仅适用于长期实施。 这通常是研发驱动型机构的感知方法,它们拥有资源可以长期投资。 但在许多行业合作伙伴和公司中,资源不足,或者优先事项没有到位,无法仅进行长期投资。
那么策略就朝着相反的方向发展,数据科学和人工智能仅用于短期结果和用例。 然后我们看到,数据科学运营将变得效率低下。 随着时间的推移,价值主张会下降,因为没有足够的投资用于中期和长期的能力建设。
为了维持数据科学和人工智能带来的价值创造,我认为一个明智的战略路线图将是在研发驱动的探索性核心能力建设策略以及可以立即执行的现实世界影响之间进行投资。
因此,我认为在两者之间取得平衡是任何数据科学运营的理想状态。在百分比方面,这根指针的位置如何?你想在研发探索核心能力建设和执行方面投入多少,将取决于任何公司的优先事项、时间表以及多个内部合作伙伴的协同一致。
MICHAEL KRIGSMAN:好建议。每个人都应该清楚地在他们组织的特定时间点或他们对未来的预测中,找到他们平衡的点。说到未来,我们能结束吗?你能给我们一些关于数据驱动的药物发现和开发将走向何处的见解吗?
BÜLENT KIZILTAN:我对数据科学将产生的影响非常乐观。今天我们看到许多公司在这个特定领域涌现。大型公司正在大量投资使用数据科学和人工智能方法进行药物发现,但我认为我们仅仅处于旅程的开始。来自学术界和研发驱动机构的方法非常有前景。整个流程中的成熟执行尚未发生。
所以这是一个持续的过程。要看到这种影响真正显现出来还需要数年时间,但我对未来非常乐观。我希望人工智能和数据科学能够成为整个药物发现和开发过程的关键组成部分。
MICHAEL KRIGSMAN:Bülent,你认为数据驱动的药物发现和开发将走向何处?
BÜLENT KIZILTAN:我们今天正在看到影响和价值创造,这来自人工智能和数据科学在药物发现和开发过程中的实施。但我认为我们仅仅处于旅程的开始,主要是因为整个流程的演变在生物技术和制药领域相当缓慢。
此外,当我查看领先机构和数据科学领域的先驱开发的可用于药物发现的方法时,这些方法才刚刚进入该过程。因此,我非常乐观地认为,人工智能和数据科学在整个药物发现过程中的影响力和足迹,在不久的将来可能会呈指数级增长。
MICHAEL KRIGSMAN:好的,这是一次引人入胜的谈话。Bülent,非常感谢你抽出时间与我们交谈。我真的很感谢。
BÜLENT KIZILTAN:感谢你的邀请。Michael,和你聊天总是很愉快。我们一直在与 Bülent Kiziltan 交谈。他是诺华人工智能创新实验室的因果关系和预测分析负责人。非常感谢 Redis 让这次谈话成为可能。
电子书
数字经济正在挑战银行家重新评估他们的商业模式。了解在向实时金融服务转变时出现的四种常见挑战的解决方案。