“我们正在构建各种能力,这些能力不仅使我们能够使用大数据,而且还可以有效且高效地从有限的数据中提取新的见解。您可以使用不同的方法来增强数据……并且基本上构建创新的方法,从您可以访问的整个信息中提取组合的见解。”
Bülent Kızıltan
诺华公司人工智能创新中心因果与预测分析负责人
Bülent Kızıltan 博士是诺华公司因果与预测分析创新的领导者,诺华公司是全球最大的制药公司之一。在人工智能创新中心,Bülent 负责与学术界和业界的合作伙伴一起推动人工智能前沿发展,以帮助更快地将新药推向市场。
在本集中,您将学习如何使用数据科学来领导并使用新的人工智能方法来加速创新,这些方法有助于将大数据与有限信息相结合以提取见解。 Kızıltan 博士分享了有效管理大量数据和组件以推动业务增长的策略。我们还将探讨公司如何缓解偏见、评估道德规范并吸引多元化人才。
Kızıltan 博士拥有天体物理学博士学位,专注于应用数学,以及天文学和天体物理学的两个硕士学位,专注于统计学。他因其在哈佛大学的领导力、指导和教学而获得了无数荣誉和奖项。他目前担任《哈佛商业评论》和《麻省理工科技评论》的顾问委员会成员。
诺华 – Bulent
MICHAEL KRIGSMAN:我们正在与诺华公司人工智能创新实验室的因果与预测分析负责人 Bülent Kiziltan 交谈。 他们是一家大公司。这将是一场关于数据驱动的药物发现和开发的精彩对话。 Bülent,你好吗?很高兴见到你。
BÜLENT KIZILTAN:很高兴见到你,Michael。谢谢。你好吗?
MICHAEL KRIGSMAN:我很好。Bülent,请告诉我们诺华公司以及人工智能创新实验室。
BÜLENT KIZILTAN:诺华公司是一家美国瑞士跨国公司。全球最大的制药公司之一,拥有超过 100,000 名员工。 人工智能创新实验室是最近成立的,现在已经成立一年多了。该公司几年前就制定了具有远见的路线图,将诺华公司转变为一家数据科学公司。在这种背景下,诺华公司了解到我们需要真正推动人工智能创新领域的发展。
我们知道,只有同时从战略上将学术界、科技界和制药界联系起来,才有可能站在人工智能创新的前沿。而且,在更广泛的制药和生物技术领域,传统的标准数据科学运营是不可能做到这一点的。 因此,人工智能创新实验室的战略定位是连接到学术界的各个学科。 基本上,挖掘在该领域创造的知识。
并与该领域的领先机构和先驱者共同开发、共同创新。 此外,还与微软研究院等科技巨头合作,真正将该技术引入运营。然后,跨越内部的学科界限和业务部门,以推动诺华公司的发展。
MICHAEL KRIGSMAN:Bülent,您是人工智能创新实验室的因果与预测分析负责人。 那么,这个角色包括什么?
BÜLENT KIZILTAN:在创新实验室,我们有三个支柱。 其中一个侧重于图像分析和可视化,由我的同事领导。 另一个支柱是 NLP,它也专门用于自然语言处理。 我们在人工智能数据科学、机器学习意义和高级统计方面所做的其他一切都属于我的团队的职责范围。 除了我们所做的传统数据科学之外,我们还在构建因果推理和因果发现空间的能力。
MICHAEL KRIGSMAN:我们正在谈论数据。 因此,当您讨论因果关系和进行推断时,这意味着数据。 那么,数据如何在药物发现过程中发挥作用?
BÜLENT KIZILTAN:数据已经处于我们的决策过程、药物发现和开发过程的中心。 因此,当我们几年前决定改变内部文化,并为诺华公司制定成为数据科学公司的路线图时,我们的意思是,我们如何确保我们能够更有效地利用数据,并确保我们的决策由数据驱动?
这对于药物发现、药物开发以及我们在诺华公司内部所做的其他一切都是有效的。 因此,具体在药物发现领域,诺华生物研究所已经拥有大量数据。 已经拥有接近 20 PB 的数据,其中包含图像、扫描、化学信息和化合物库,其中包含超过 – 接近 200 万种化合物的信息。
那么,我们如何真正地组合所有这些信息,并确保需要花费数年时间和数十亿美元的整个发现和开发过程变得更有效率、更短时间? 而且,我们不必在实验室中完成所有事情,而是可以在计算机上完成,即使用计算建模。
这就是我们前进的方向。 数据在整个过程中起着关键作用。 数据科学和人工智能创新的目标是加快这一过程,并利用我们以前无法有效利用的信息领域。
MICHAEL KRIGSMAN:因此,从根本上说,与过去相比,区别在于使用计算方法而不是基于实验室的方法。
BÜLENT KIZILTAN:我想说,此外,我们基本上是在增强整个过程。 而且,有时我们可以模拟信息和数据,我们可以用它来添加到实验室中创建的信息证据中。 因此,我们基本上是在合作,取代了实验室的数据。 此外,我们还在构建各种能力,可以帮助我们有效地组合来自我们所说的不同形式的信息。
例如,如果我们有图像,如果我们有化合物,传统的分析和组合方法是在这两种不同的形式中分别运行分析。 然而,借助来自数据科学领域的新颖创新方法,我们可以有效且更高效地组合这些信息以提取新的见解。
MICHAEL KRIGSMAN:那么,数据的角色是否正在发生变化,或者它是否 – 我会说“仅仅”是收集不同类型的数据? 因此,与过去相比,数据的使用是否正在发生根本性的变化?
BÜLENT KIZILTAN:我想说它正在发展,并且处于持续发展的道路上。 我们如何真正地使用数据,以及创建数据和记录数据。 这就是为什么整个数据科学领域具有高度跨学科性。我们需要与来自科技领域的合作伙伴携手合作。
此外,与学者合作,引入他们在该领域建立的最前沿的知识。 并有效地结合起来,以提出新的见解,提出新的组合方法。 此外,我们一直在探索生产新型数据以增强整个过程的方法。
MICHAEL KRIGSMAN:您处理多少数据?
BÜLENT KIZILTAN:这取决于用例。 有时是非常有限的数据,有时我们处理的是太字节到拍字节级的数据。 但实际上,这取决于用例、什么领域、什么疾病领域、我们正在研究的具体药物。 在医疗保健领域,我们基本上需要构建各种能力,这些能力使我们能够从小型和有限的数据以及大数据中提取信息。
如果您愿意,这在数据类型和我们处理的数据大小方面是整个信息内容范围。 未来的创新不仅在于大数据,而且我们还需要能够有效地从小型数据中提取信息。 因此,这确实取决于情况。
MICHAEL KRIGSMAN:当涉及到机器学习等活动时,我们确实倾向于考虑大量数据,但您也与稀疏数据密切合作,在这些数据中您没有那么多数据,但仍然需要推动和得出某些类型的重要结论。
BÜLENT KIZILTAN:你说的没错,Michael。 具体而言,在医疗保健领域,我们常常受到我们可以为特定用例收集的信息量的限制。 我们不能只是凭空构建方法论,然后尝试将其应用于不同的用例或问题集。
因此,我们正处于数据科学和人工智能领域的不断发展中,在该领域中,方法论和创新前沿不仅仅受方法驱动,而是受可用数据类型驱动。 这就是为什么我们人工智能创新中心作为一个团队,正在构建各种能力,这些能力不仅使我们能够使用大数据(如果您愿意),而且还可以有效且高效地从有限的数据中提取新的见解。
您可以使用不同的方法来增强数据,而且还可以使用一些非常成熟的应用数学方法来组合这些信息,并且基本上构建创新的方法,从您可以访问的整个信息中提取组合的见解。
MICHAEL KRIGSMAN:您能否为我们提供一些关于您正在查看的数据类型的背景信息,或者通常在制药行业中正在使用的数据类型?
BÜLENT KIZILTAN:是的,因此信息可能来自药物发现领域的化合物库。 它来自 Web 实验室。 它有时来自公开可用的患者记录。 有图像。 有时还会在过程中录制视频。
因此,无论我们掌握什么信息,都会因用例而异。 有基因组信息。 有验血。 我们可以利用实验室分析。 此外,我们还使用大量公开可用的数据来增强整个内部预测过程。
MICHAEL KRIGSMAN:因此,您正在从诺华公司内部以及各种不同类型的外部参考来源收集这种非常广泛的数据。 所有这些都会在您进行分析时进入药物发现和开发过程。
BÜLENT KIZILTAN: 完全正确。诺华公司拥有独特的优势,在过去的二十年中,它记录了超过 200 万患者年的数据,这些数据可以供我们的数据科学家和生物学家在内部访问。
除了诺华生物医学研究所创建和获取的数据(可以访问化学数据、图像和生物学数据,尤其是生物学数据)之外,我们还在引入大量的数据。而且,我们还在利用公开可用的数据来增强整个预测过程。
MICHAEL KRIGSMAN: 需要什么样的基础设施来管理所有这些不同类型的数据?无论是在诺华公司内部,还是在整个行业中。
BÜLENT KIZILTAN: 让数据易于访问,并防止数据科学家将大部分时间花在数据整理和数据管理上,我认为这是每个大型制药公司的主要目标之一,因为存在大量的法规。
因此,公司一直在投资数十亿美元来构建基础设施,使其数据在内部流畅,这意味着可以直接访问并随时进行分析。因此,数据科学家可以使用创新的技术和架构,与领域专家合作,从而对整个过程产生更多的见解。
MICHAEL KRIGSMAN: 这通常是 IT 部门的职能,还是谁负责构建该基础设施?再次强调,只是就整个行业而言。
BÜLENT KIZILTAN: 是的,IT 部门绝对是整个过程中的主要参与者和合作伙伴。但是,根据公司的战略、优先级和资源,它可能隶属于哪个业务部门和职能部门。我们有一个特定的数据和人工智能职能部门,与 IT 部门密切合作。我们进行跨职能工作,以构建并使我们的所有数据科学家都可以真正使用该基础设施。
MICHAEL KRIGSMAN: 那么云与本地部署的问题呢?这是否会影响您收集、获取、使用和解释数据的方式,云与本地部署?
BÜLENT KIZILTAN: 是的,这是我们的技术领域合作伙伴正在解决的问题。当然,我们有一个主要的合作伙伴,即微软研究院和人工智能创新实验室。我们正在与他们合作,并使用他们的云基础设施来构建我们的数据管道。但是,我们也有内部基础设施,可以让我们进行快速的探索性研究,并对其进行扩展。因此,我们基本上是在两端进行投资。
MICHAEL KRIGSMAN: 是的,两端是指云和本地部署。
BÜLENT KIZILTAN: 内部基础设施,是的。
MICHAEL KRIGSMAN: Bülent,对于这种类型的药物发现和开发,实时数据是否发挥作用?
BÜLENT KIZILTAN: 因此,我们肯定会使用所谓的纵向数据,这些数据是在不同时间记录的数据。但是,这些数据主要是记录下来的,然后我们对这些数据进行回顾性分析。因此,我们不进行实时分析。但是在其他职能部门中,存在基础设施,实时数据可能很重要。
MICHAEL KRIGSMAN: 您能否给我一个实时数据可能很重要的例子?我之所以这样问,是因为人们会认为,在药物发现中,您会收集这些数据,然后在收集后分析这些数据,您会对其进行解释,然后得出某种结论。而这并不是我们通常考虑实时数据的方式。
BÜLENT KIZILTAN: 完全正确,因此在药物发现和开发领域,我想说我一直使用的所有数据都是记录下来的,但是数据中存在一个时间维度,在分析中起着非常重要的作用。但是在内部,有些职能部门可能与市场分析有关,需要利用实时数据来进行分析和预测。这可能会使用一些实时数据,但我个人没有使用过这些类型的数据。
MICHAEL KRIGSMAN: 显然,这与药物发现和开发本身的过程不同。
BÜLENT KIZILTAN: 完全正确。因此,在药物发现和开发领域,这些过程通常会持续很长时间。人工智能和数据科学的目标之一是缩短该过程。因此,大多数数据都是被记录下来的,但是它们具有时间维度,我们会在分析中真正利用并使用它。
MICHAEL KRIGSMAN: 因此,实际上,一个重要的目标是缩短纵向周期,以便更快地得出结论并更快地将药物推向市场。
BÜLENT KIZILTAN: 完全正确。随着在特定药物开发和发现过程中花费的时间增加,成本会线性增加。而且可能需要很长时间的原因,至少有一个方面是生成证据并将队列和患者纳入研究中。
借助机器学习数据科学,我们可以通过使用我们正在开发的一些方法来创建额外的证据,从而缩短周期,还可以针对更适合特定研究的特定患者和队列。因此,机器学习绝对有助于缩短研究时间,并降低药物开发和发现的成本。
MICHAEL KRIGSMAN: 您是否知道是否已经进行了有关机器学习在缩短将药物推向市场的时间方面的有效性的研究?
BÜLENT KIZILTAN: 是的,从药物发现到开发的整个过程是一个非常漫长的过程,涉及多个活动部件。机器学习目前在大多数活动部件中都发挥着作用,并且有可能对其他剩余的活动部件产生重要而积极的影响。因此,我们正在积极投资并研究构建增强功能的各种能力,以增强整个管道中的每个活动部件,从而为该过程做出贡献。
MICHAEL KRIGSMAN: 您面临哪些数据挑战?无论是收集高质量的数据、一致的数据,还是您遇到的任何其他问题,或者整个行业在收集所有这些不同类型的数据时遇到的问题。
BÜLENT KIZILTAN: 正如您已经提到的那样,Michael,机器学习,特别是标准方法依赖于正在收集的数据中的信息量。因此,数据越多越好。在医疗保健和生物技术领域,数据量是一个持续存在的问题,因为收集数据需要很长时间,才能使其足够干净,以供数据科学家使用。
而且,由于严格的法规,跨不同业务部门访问数据可能具有挑战性。因此,以上您提到的所有内容,获取干净的数据、获取我们产生证据所需的数据量,以及与基础设施投资相关的数据访问,都是整个过程的重要方面。
MICHAEL KRIGSMAN: 与进行传统实验室工作的人们相比,您是否面临着不同的数据挑战?
BÜLENT KIZILTAN: 我会说是,也不是。当我们从不同的实验室、外部供应商以及内部临床试验中收集数据时,我们面临的一些不同挑战是真正结合来自不同来源的信息。
内部偏差可能非常不同。噪声可能非常不同。而在实验室中,管道可能非常同质,即使它可能存在偏差。但是,一旦他们识别出特定的偏差,就可以立即解决。而当我们使用多个数据源时,潜在的问题和偏差可能会更加复杂。
MICHAEL KRIGSMAN: 显然,在实验室中,它是一个更可控的环境,而您正在接受所有来者,可以这么说。
BÜLENT KIZILTAN: 完全正确。正如您所说,在实验室中可以控制事情,但是对于实验室中的人们来说,手动完成事情仍然是一个痛苦的过程。
而我们正在尝试尽可能地自动化该过程,我们基本上利用可以称为半监督、无监督或自监督的方法。因此,我们在构建方法时,会逐步增加复杂程度,我认为这在过程中至关重要。
MICHAEL KRIGSMAN: 您提到了偏差。当您使用这些大型数据集时,如何确保将偏差水平降至最低?
BÜLENT KIZILTAN: 这是一个非常好的问题。该领域正在积极投资以构建明确的策略,以解决数据收集和分析中的偏差。因此,我们可以讨论两种类型的偏差。其中一种是数据固有的,我们可以使用安慰剂组进行测试。
或者,如果我们有另一组可以比较的数据,我们可以找到一个指标,可以让我们深入了解数据的内容或数据本身存在哪些类型的偏差。然后,我们还有一些偏差可能来自我们所应用的方法。
在那里,我们也有一些可以用来有效衡量可能存在哪些类型偏差的方法。因此,不确定性预测在这里起着至关重要的作用,它可以帮助我们了解我们正在预测的内容。这是数据科学中一个持续进行且动态发展的领域。
MICHAEL KRIGSMAN: 听起来无论是固有的偏差还是流程上的偏差,偏差问题对于您的团队和整个行业来说都是非常重要的问题。
BÜLENT KIZILTAN: 非常重要,这在医疗保健和生物技术领域尤其重要,因为我们基于模型做出的决定会影响患者的生活。因此,我们正在投资真正识别这些偏差,并尝试提出符合道德规范的方式来定义我们的管道和流程。
MICHAEL KRIGSMAN: 伦理问题也是一个非常棘手的问题。
BÜLENT KIZILTAN: 完全正确。
MICHAEL KRIGSMAN: 您想详细说明为什么伦理方面具有挑战性吗?
BÜLENT KIZILTAN: 是的,人工智能和伦理以及人工智能的其他领域一直在发展。但是,它没有像其他领域那样快速成熟的原因之一是,我们没有社会科学领域的投资和合作伙伴参与进来,并与工程师和科学家合作解决特定问题。
我们已经看到这种合作关系在发展并变得更加成熟,但是我们仍然需要找到与社会科学和学术界以及其他可以真正为整个事业做出贡献的参与者进行交叉的方法。这不仅是一个技术问题,而且还有一些主题确实涉及到我们所做工作的技术方面。
但是它与社会科学有关,与理解社会,技术以及长期后果有关。因此,它是一个真正的跨学科领域,而这种合作关系的发展速度不及人工智能的技术方面。
MICHAEL KRIGSMAN: 显然,当涉及到诸如公平获取医疗资源、研究疾病的种类、成本等等问题时,医疗保健与几乎所有其他领域都截然不同,原因显而易见。对吧,因为如果你生病了,你不会关心花多少钱。但与此同时,你也不希望自己的医疗保险费用上涨。所以很明显,社会因素非常复杂,这是无需赘述的。
BÜLENT KIZILTAN: 非常正确,Michael。医疗保健、生物科技、制药是一个非常复杂的领域。需要多个合作伙伴积极参与讨论,并开发我们在前沿推进的方法。
我们不能只由学术界驱动。我们也不能只由技术驱动。我们必须与来自不同学科的领域专家进行有效的合作。这确实是一个跨学科的领域,有时会非常困难,但值得投入,而且令人兴奋。
MICHAEL KRIGSMAN: 请介绍一下你团队的组成。你已经多次提到跨学科方面,你的团队是如何体现这种强调的?
BÜLENT KIZILTAN: 因为数据科学和人工智能是高度跨学科的,我们一直致力于吸引能够将他们多元化的背景带入到我们的运营和流程中的人才。所以我们吸引了来自非常不同领域的人才,包括物理学、数学、生物信息学、化学,等等。我们甚至有具有社会科学背景的人,他们在这些基础上建立了一些分析技能,并为我们正在进行的工作做出贡献。
MICHAEL KRIGSMAN: 所以你们把具有非常不同背景的人聚集在一起。
BÜLENT KIZILTAN: 是的。数据科学中非常重要的一点是,我们不能只关注他们带来的能力。主要是因为能力如果不加以培养,可能在六到九个月内就会过时。
所以我们希望吸引那些真正能够学习、适应、并且真正跨学科和充满好奇心的人才。这就是为什么当我出去与我的同行和同事交谈时,除了他们带来的能力之外,我更关注他们的好奇心和学习潜力。
MICHAEL KRIGSMAN: 所以不仅仅是拥有科学背景的问题,他们还需要正确的思维方式和文化。
BÜLENT KIZILTAN: 绝对是这样,有时这甚至更重要。凭借学习我们所做工作的技术方面的潜力,这是非常技术性的,我认为思维方式在数据科学和人工智能领域取得成功方面起着关键作用。
MICHAEL KRIGSMAN: 所以他们需要正确的技术实力,解决您所面临问题的正确技术技能,以及文化和思维方式。作为基线,他们至少需要具备哪些核心技术技能?
BÜLENT KIZILTAN: 肯定是对我们工作中的数学、机器学习和计算方面有良好的理解,这是我们寻找的最低限度的技术能力。但除了这些,我们还希望吸引能够学习和适应不断变化的环境的人才。
能够快速消化数据和信息并执行,因为今天相关的东西可能在六到九个月内就会过时,正如我刚才提到的。因此,除了数学和计算核心能力之外,我们还在寻找能够在短时间内适应、学习和执行的人才。
MICHAEL KRIGSMAN: 所以这种适应性是关键,因为药物发现和开发正在以非常快的速度发展。
BÜLENT KIZILTAN: 没错,尤其是在药物发现之上的数据科学,其发展速度甚至更快。所以当我们坐在房间里时,通常情况下,我的意思是,我们觉得我们对生物学或化学领域正在讨论的主题一无所知。
我本人来自天体物理学背景,但我们需要能够有效地沟通,消化和理解来自领域专家的信息。并将这些信息实施并整合到我们正在开发的方法中。因此,能够真正理解信息、消化信息并将其融入到我们的工作中,我认为对于未来取得成功至关重要。
MICHAEL KRIGSMAN: 这非常有趣。所以你拥有你的领域专业知识,但同时你也在从生物制药以外的其他领域汲取数据、能力、技能和技术分析能力。
BÜLENT KIZILTAN: 是的,所以我们的方法和技术路线图是由我们可获得的信息驱动,并且应该由这些信息驱动。主要是,它应该是数据驱动的,但是如果我们不能与领域专家进行有效的沟通,我们基本上就是盲目的。如果我们不使用这些领域信息,我们就会是纯粹的经验主义者。这对于构建一个全面的机制也起着关键作用,该机制将为我们正在解决的任何问题提供额外的见解。
MICHAEL KRIGSMAN: 所以再次强调,不一定是诺华公司具体情况,但数据显然具有高度的领域特殊性,但分析技术可能来自其他领域,这样说是正确的吗?
BÜLENT KIZILTAN: 绝对正确,这就是创新的前沿所在。事实上,我已将一些在天体物理学、应用数学领域开发的技术应用于新的问题集。这是创新的两种方式之一。一种创新方式是构建和开发新方法,但另一种创新方式是将高级方法应用于新问题。这正是我们所做的。
MICHAEL KRIGSMAN: 有趣,所以创新可以来自你如何收集数据、数据的类型、你在哪里收集这些数据。但创新也可以来自你用来操作该数据体的分析技术。
BÜLENT KIZILTAN: 是的,第二种说法绝对正确。我们可以使用在不同领域开发的方法,应用于新的问题集。我们也在与领先的机构和先驱者合作开发和创新尚未出现的新方法,这是全新的。然后我们可以将其应用于标准问题以及新问题。
MICHAEL KRIGSMAN: Bülent,好的。所以你在与一群非常非常聪明的人打交道,在许多情况下都是行业领先的人物。无论是你的合作伙伴学术机构,还是你团队中来自不同背景的人。所以我的问题是一个非常基本的问题,你是如何避免他们互相残杀的?
BÜLENT KIZILTAN: 这是一个好问题。吸引具有多元化背景的人才,肯定有利有弊。当然,将这种多元化的背景和见解汇集到给定的问题中,是非常非常有价值的。但同时也带来了具有不同文化背景的不同性格。
他们如何处理信息,他们的沟通方式可能会非常具有领域特殊性。因此,这对领导者提出了挑战,他们必须真正利用自己的领导技能来建立一个能够作为一个团队运作的有效团队,并且可以作为一个团队执行,这当然是一个挑战。我们在全球研究中看到的两个特征,是数据科学运营成功或失败的决定性因素,实际上不是技术能力。
其中之一是领导力的类型,第二个是文化。这两者在确定数据科学运营在中长期内是否能够成功方面都密切相关。当然,我一直在倡导并在公开演讲中告诉学生的是,除了技术技能之外,一定要投资于你的软技能。
因为这不仅对你的内部团队非常重要,而且当你与来自不同学科的领域专家沟通时也很重要。因为每个人的沟通方式都非常不同,并且为了理解问题是什么,打开有效的沟通渠道是第一步,然后我们将在其之上构建解决方案。
MICHAEL KRIGSMAN: 我必须假设,除了你如此雄辩地描述的沟通之外,非常清楚的结果必须是首要考虑的,以及一种协调团队并让每个人朝着同一方向努力,以实现相同或共同目标的方法。
BÜLENT KIZILTAN: 绝对正确,以结果为导向非常重要,但数据科学也具有探索性。有时,这可能会限制整个过程。它可能会使事情变得不那么明确。
因此,领导者有责任澄清该过程,并制定一个考虑到整个过程探索性方面的路线图。所以当然,我们需要探索。我们不能总是从一开始就确定某些结果。我们需要能够适应传入的信息,并相应地构建风险。
MICHAEL KRIGSMAN: 这很难。管理这种研发确实很难,因为你要处理很多未知因素。
BÜLENT KIZILTAN: 没错。所以在数据科学运营中,我们看到的是,主要由业务部门驱动结果。这基本上不是发生创新的地方,但另一方面,大多数数据科学运营都是研发驱动的,其中进行了大量的探索。
我们对创新的看法和方法,是在研发和实际执行之间找到战略平衡。当然,这将成为一种由公司的优先事项和资源驱动的平衡。
MICHAEL KRIGSMAN:Bülent,鉴于所有这些情况,您对人工智能领导者或一般商业领袖有什么建议,关于管理人工智能团队,并在他们自己的组织内部变得更有效率,处理大量数据,甚至处理您之前描述的稀疏数据问题?
BÜLENT KIZILTAN:数据科学和人工智能的价值主张不仅仅是用于长期实施。这通常是研发驱动型机构的感知方法,它们有资源只为长期投资。但在许多行业合作伙伴和公司中,没有足够的资源,或者没有足够的优先事项来只为长期投资。
然后策略走向相反的方向,数据科学和人工智能仅用于短期结果和用例。我们看到的是,数据科学运营将变得效率较低。而且价值主张会随着时间的推移而下降,因为没有足够的投资用于中期和长期能力建设。
因此,为了维持数据科学和人工智能带来的价值创造,我认为一个明智的战略路线图是将投资同时投入到研发驱动的探索性核心能力建设战略,以及可以立即执行的现实世界影响中。
所以我认为,在这两者之间取得平衡,对任何数据科学运营来说都是一个理想的位置。至于这个针头在百分比方面的位置,你想在研发探索性核心能力建设以及执行方面投入多少,将取决于优先级、时间线以及任何公司内部多个合作伙伴的协调一致。
MICHAEL KRIGSMAN:非常好的建议。每个人都应该清楚地了解,在特定时间为他们的特定组织取得平衡的位置,或者他们预计未来会取得平衡的位置。说到未来,我们能结束吗——您能让我们了解一下数据驱动的药物发现和开发的发展方向吗?
BÜLENT KIZILTAN:我对数据科学将产生的影响非常乐观。今天,我们已经看到许多公司在这个特定领域出现。更大的公司正在大量投资于在药物发现中使用数据科学和人工智能方法,但在我看来,我们仅仅处于这段旅程的开始阶段。从学术界和研发驱动型机构涌现出来的方法论非常有前途。整个管道中的成熟执行尚未实现。
所以这是一个持续的过程。我们需要几年时间才能看到这种影响真正出现,但我对未来非常乐观。我希望人工智能和数据科学将成为整个药物发现和开发过程的关键组成部分。
MICHAEL KRIGSMAN:Bülent,您认为数据驱动的药物发现和开发的发展方向是什么?
BÜLENT KIZILTAN:我们今天看到了人工智能和数据科学在药物发现和开发过程中实施所带来的影响和价值创造。但我认为我们仅仅处于这段旅程的开始阶段,主要是因为整个管道的演变在生物技术和制药领域相当缓慢。
而且,当我看到领先机构和数据科学领域的先驱们正在开发的方法论,这些方法论可以在药物发现中实施,它们才刚刚进入这个过程。所以我非常乐观地认为,人工智能和数据科学在整个药物发现过程中的影响和足迹,可能会在不久的将来呈指数级增长。
MICHAEL KRIGSMAN:好的,多么引人入胜的对话。Bülent,非常感谢您抽出时间与我们交谈。我真的非常感谢。
BÜLENT KIZILTAN:感谢您的邀请。迈克尔,很高兴与您交谈。我们一直在与诺华人工智能创新实验室的因果和预测分析主管 Bülent Kiziltan 交流。非常感谢 Redis 使这次对话成为可能。
电子书
数字经济正在挑战银行家们重新评估其业务模式。了解在转向实时金融服务时出现的四个常见挑战的解决方案。