视频

了解更多
数据经济是一个视频播客系列,介绍利用数据对其业务、客户和世界产生积极影响的领导者。要查看所有当前剧集,请探索下面的播客剧集库。
当您的算法必须在 10 到 20 毫秒内处理每秒数千到数万笔交易时,您不能简单地将您的 机器学习 (ML) 模型放到云中。
当您的 ML 模型影响大约 80% 的所有信用卡交易时,您也不能牺牲准确性或可解释性。
这些只是 Scott Zoldi,FICO 首席分析官,在他最近接受 数据经济 播客采访时分享的一些要求。Zoldi 不回避分享挑战、见解和方法论,说明像 FICO 这样拥有 60 年历史的公司是如何推动其实时机器学习模型的研发、基础设施和持续管理的边界的。
Scott 拥有 100 多项已授权专利,分享了以下见解,但您需要观看播客才能获得他所有详细的智慧。
Scott 从客户的角度简化了延迟要求:“你能想象你在收银台等待你的信用卡结算需要两秒钟吗?没有人有耐心等待。”
推动 FICO 要求的不仅仅是延迟,因为在欺诈和信用决策方面做出错误的决定会损害消费者、商家、银行和其他金融机构。Zoldi 分享了 FICO 架构其客户解决方案时,延迟、分析准确性、成本和其他约束之间的权衡的见解。
在播客中,CIO、CDO 和 IT 领导者将了解 FICO 如何通过其数据科学和技术方法创造新的商业机会,保护其声誉,并在竞争中占据优势。正如 Scott 所说:“对于 FICO 来说,独特之处在于我们已经在大规模实时运行了三十多年。这确实是我们的核心业务。”
对于数据和 IT 领导者来说,选择 企业实时数据平台 并在 多云环境 中运行它们是构建、测试、集成和部署机器学习模型的基础。
在实时流式传输环境中,了解数据序列对于决策至关重要。例如,您可能希望 FICO 看到您的电子邮件在大量交易发生前几秒被更改,然后实时向商家发出高度可能的欺诈交易警报。
ML 模型的速度和准确性会影响 FICO 在架构决策中,决定数据处理和模型运行的哪些部分位于边缘计算和其他在云中运行的元素上。“如果我占用毫秒,仅仅往返云端,就会给整体价值主张增加开销,”Scott 强调说。
这不仅仅是基础设施的限制。Scott 分享了以下关键见解,说明为什么他的团队在将 ML 模型投入生产用例之前要对其进行研究和开发:“在基于云的环境中找到的一些通用功能可能并不真正适合实时计算。”
这对争论其架构的数据和 IT 领导者来说是一个关键见解,尤其是围绕优化混合和多云架构、扩展数据层(提示:FICO 看得远不止传统的数据库)或管理低延迟和高服务质量。
数据和 IT 架构师的一个关键策略是开发 灵活的数据结构,例如键值数据存储、地理空间索引和数据流,以支持管理、索引和查询各种实时数据集。
虽然 Scott 负责 FICO 的分析功能,但它需要数据科学家、软件开发人员和云工程师之间的紧密协作,才能将模型集成到实时生产环境中。“我们是产品经理的一部分,因为我们对满足业务目标所需的内容有自己的看法,”Scott 说。“我们必须推进我们的软件如何处理实时约束的最新技术。我们在我们的角色、数据科学家、产品经理和软件开发人员之间有这种紧密的联系。”
对于 FICO 来说,开发和支持全生命周期支持始于只探索完全可解释的 ML 模型的研发团队。该公司也不将所有数据资源投入到每个问题中,并且不希望通过引入超出所需的数据来引入偏差。Scott 认识到“每个引入解决方案的数据元素都增加了决策的责任。”
该团队超越了可解释的 AI,在播客中,Scott 分享了他对“谦逊的 AI”、“负责任的 AI”和“可解释的 AI”的定义。他认为,将来,客户是否、如何以及何时允许其数据用于模型的同意将需要新一轮的合规性和创新。
请收听播客,了解更多 Scott 关于为 实时金融服务 开发和支持 ML 模型的见解。
观看更多 数据经济 播客的剧集。