dot Redis 8 来了——而且是开源的

了解更多

数据经济:FICO 优化其机器学习模型以实现实时金融服务的三种方法

数据经济是一个视频播客系列,讲述了使用数据对他们的业务、客户和世界产生积极影响的领导者。要查看所有当前剧集,请浏览下面的播客剧集库。


当您的算法必须在 10 到 20 毫秒内每秒处理数千到数万笔交易时,您不能仅仅将您的 机器学习 (ML) 模型放在云中。

而且,当您的 ML 模型影响大约 80% 的信用卡交易时,您不能牺牲准确性或可解释性。

这些是 FICO 首席分析官 Scott Zoldi 在最近接受数据经济播客采访时分享的一些要求。 Zoldi 并不回避分享挑战、见解和方法论,说明像 FICO 这样一家拥有 60 年历史的公司如何突破实时机器学习模型的研发、基础设施和持续管理的界限。

拥有超过一百项专利的 Scott 分享了以下见解,但您必须观看播客才能获得他所有详细的智慧。

技巧 1:了解客户影响

Scott 从客户的角度简化了延迟要求:“你能想象你在销售点,需要等待两秒钟才能让你的信用卡通过吗?没有人有这样的耐心。”

不仅仅是延迟驱动着 FICO 的要求,因为围绕欺诈和信用决策做出错误的决定会损害消费者、商家、银行和其他金融机构。 Zoldi 分享了 FICO 在构建客户解决方案时,在延迟、分析准确性、成本和其他约束之间权衡的见解。

在播客中,CIO、CDO 和 IT 领导者将了解 FICO 如何通过其数据科学和技术方法创造新的商机、保护其声誉并获得竞争优势。正如 Scott 所说,“对于 FICO 来说,独特之处在于我们已经大规模实时运行了三十多年。这确实是我们赖以生存的基础。”

对于数据和 IT 领导者来说,选择企业实时数据平台并在 多云环境中运行它们是构建、测试、集成和部署机器学习模型的基础。

https://www.youtube.com/embed/oshYnZYnvkI

技巧 2:优化基础设施和 ML 模型以满足实时数据处理要求

在实时流处理环境中,了解数据序列对于决策至关重要。例如,您可能希望 FICO 看到您的电子邮件在大型交易发生前几秒钟被更改,然后标记商家关于极有可能的欺诈交易——所有这些都是实时的。

ML 模型的速度和准确性进入了 FICO 关于哪些数据处理和模型部分在边缘计算上运行,哪些部分在云中运行的架构决策。 “如果我耗费毫秒级的时间,只是为了到达云端并返回,这会增加整体价值主张的开销,”Scott 强调。

而且不仅仅是基础设施的限制。 Scott 分享了关于他的团队为何在准备将其用于生产用例之前研究和开发 ML 模型的关键见解:“您在基于云的环境中找到的一些商品功能可能并非真正用于实时计算。”

对于正在争论其架构的数据和 IT 领导者来说,这是一个关键的见解,尤其是在优化混合和多云架构、扩展数据层(提示:FICO 超越了传统的关系数据库),或管理低延迟和高质量的服务方面。

数据和 IT 架构师的关键策略是开发灵活的数据结构,例如键值数据存储、地理空间索引和数据流,以支持管理、索引和查询各种实时数据集。

技巧 3:培养多学科协作以支持 ML 模型的完整生命周期

虽然 Scott 负责监督 FICO 的分析功能,但它需要数据科学家、软件开发人员和云工程师之间的强大协作,才能将模型集成到实时生产环境中。 Scott 说:“我们是产品经理的一部分,因为我们对需要满足的业务目标有一个看法。 “我们必须推进我们的软件如何处理实时约束的最新技术。我们、数据科学家、产品经理和软件开发人员的角色之间有着紧密的联系。”

对于 FICO 来说,开发和支持完整的生命周期支持始于仅探索完全可解释的 ML 模型的研发团队。该公司也不会将所有数据资源都投入到每个问题上,并且它不想通过引入比所需更多的数据来推断偏差。 Scott 认识到“引入解决方案的每个数据元素都会增加决策的责任。”

该团队超越了可解释的 AI,在播客中,Scott 分享了他对“谦逊 AI”、“负责任 AI”和“可解释 AI”的定义。他认为,未来,客户是否、如何以及何时允许其数据用于模型将需要新一轮的合规和创新。

请收听播客,以了解更多 Scott 关于为 实时金融服务开发和支持 ML 模型的见解。


观看更多剧集的 数据经济 播客。