dot 未来速度将来到您的城市举办的活动中。

加入我们在 Redis 发布会

返回剧集列表

数据经济播客

由迈克尔·克里格斯曼主持

数据经济播客 / 由迈克尔·克里格斯曼主持

实时欺诈检测和艾字节分析

埃里克·哈勒,身份、欺诈和数据实验室执行副总裁兼总经理 / 埃克斯彼瑞安

https://www.youtube.com/embed/MGFpnvtPZcE

“通常,您看不到的数据会让您陷入困境。如果您要受到欺诈的打击,那是因为您没有分析和查看数据。”

埃里克·哈勒
身份、欺诈和数据实验室执行副总裁兼总经理 / 埃克斯彼瑞安

Eric Haller

埃里克·哈勒是埃克斯彼瑞安身份、欺诈和数据实验室的执行副总裁兼总经理,埃克斯彼瑞安是美国三大主要信用局之一,在 40 多个国家/地区开展业务,拥有 18,000 多名员工。埃里克负责监督用于查明欺诈交易的检测算法,并负责分析艾字节级数据以检测欺诈交易。

金融服务公司每天都在处理大量高度敏感的信息,因此,“拥有最新的、最准确的信息至关重要,以便在当时做出最佳决策,尤其是在信贷风险或欺诈方面”(哈勒)。在本期节目中,埃里克分享了实时欺诈检测的最佳实践,分析大型高速数据时需要考虑的技术挑战,并提供了如何通过数据洞察推动业务创新的建议。
在加入埃克斯彼瑞安之前,埃里克负责红杉资本的新产品,他创建并推出了消费者可以在零售商的 J 型钩子上购买的第一张信用卡。埃里克还共同创办了身份欺诈检测业务 ID Analytics,该公司被 LifeLock 收购,现在是赛门铁克的一部分。

文字记录

迈克尔·克里格斯曼:我们正在与埃克斯彼瑞安的埃里克·哈勒讨论实时数据。埃里克,你好吗?再次见到你真是太好了。

埃里克·哈勒:嘿,我也是。很高兴再次参加你的节目。

迈克尔·克里格斯曼:埃里克,跟我们说说埃克斯彼瑞安,以及你的角色。

当然。埃克斯彼瑞安是一家全球信息服务公司,我们在 40 多个国家/地区开展业务,拥有大约 18,000 名员工,并且涉足许多不同的行业,但您可能最了解我们的信贷业务。在美国,我们拥有三大主要面向消费者的美国信用局之一。

因此,大多数人通过它了解我们。但我们参与了许多不同的市场。可以是汽车、医疗保健、营销,等等。我的职位是业务主管。我是执行副总裁,管理我们全球的身份和欺诈损益,以及研发,我们称之为数据实验室,我管理全球的数据实验室。

迈克尔·克里格斯曼:因此,很明显,实时数据对您的业务至关重要。

埃里克·哈勒:绝对。在我们代表客户在幕后进行的任何企业中,拥有最新的、最准确的信息至关重要,以便在当时做出最佳决策。

尤其是在信贷风险或欺诈方面,随着世界进入数字环境,能够收集、汇总和分析信息,并在毫秒级内做出响应,成为该流程的关键部分。

迈克尔·克里格斯曼:因此,实时方面绝对至关重要吗?

埃里克·哈勒:是的,您必须考虑数据本身。如果你是,我们假设,是数据领域的“极客”,你会将世界细分为可以花时间思考的事情和必须立即做出反应的事情。

因此,在立即做出反应的世界中,一些信息被捕获、分析、收集并准备好。完成这些操作需要大量时间,因此一切都被准备好,因此当您需要做出决策时,它会立即准备好并可用。在我们的许多决策中,这是很大的组成部分。

但有一些决策,例如在欺诈领域,以及在数字环境中,捕获的实际数据作为交易的一部分或该过程的一部分,对于在当时做出最佳决策至关重要。因此,您将当下正在发生的事情与您从某种历史角度了解的事情结合起来,对其进行分析、评分并得出决策。

这就是我所说的实时的关键所在。许多决策是在当下做出的。它变得更具挑战性和复杂性,我们必须真正运用我所说的某些分析和技术能力,才能真正利用作为该过程的一部分捕获的信息,而该信息是得出正确决策的评分机制或机器学习过程的一部分。

迈克尔·克里格斯曼:因此,从总体上讲,实时方面对您的业务的某些部分至关重要,更重要的是,对您的客户正在做的事情至关重要。我们说的是多少数据?您运营的规模是什么样的?

埃里克·哈勒:好吧,这确实取决于查看数据的方式。例如,在研发方面,我们非常乐意利用大型数据集,即 TB 级的数据。我认为总的来说,我们的四个实验室可能定期处理大约 1 艾字节的数据,分布在四个实验室中,这大约是 1,000 PB。因此,我们习惯于使用大量数据。但这通常是您分析大量信息库以尝试提取出某些可以利用的行为时的情况。例如,嘿,这是以前从未借过款的非洲人群。那么,我们能捕获多少信息,以便我们可以提取出信号,以便我们可以了解如何向他们贷款?

在您提到的那个实时环境中,有效载荷更小,但非常简洁。就像每个数据元素都很重要。因此,数据的数量并不多。即使是 1,000 字节的数据,听起来也不多,因为您必须尝试对其做出决策,其中包含很多信息。

实时环境中的数据量可能不像涌入的信息的广度那么大,我举个例子。因此,作为消费者,您在网上购买商品,您浏览了整个过程,然后进入购物车。

您可能没有意识到,在幕后,实时发生了很多事情。这可能来自,嘿,我们正在查看您使用的设备。以及信息,捕获的特征只是设备之间在互联网上通信的一部分,并且它们正在说,我们以前见过这个设备吗?

您的设备上安装了传感器,可以捕获您执行某项操作的速度。如果您在使用移动设备,那么在任何时间点您在屏幕上可能触发的像素数量。信不信由你,这些信息实际上非常有助于了解您是否是一个真实的人,或者您是否是一个机器人。

您知道,机器人可能会发送信息,而不会在手机上触发任何像素——它可能会触发一两个像素,因为信息正在通过,我们知道手指触摸屏幕会触发至少 110 个像素。因此,这种信息正在被捕获。它是小范围的爆发,但非常有意义。我可能会——

我不知道您的眼睛是否会发呆,您是否发现我们在这个在线过程中捕获的所有不同方面的数据很有趣,只是为了验证您是真实的人类,希望我们之前与您合作过,我们的客户之前与您合作过,并且有一种舒适感,知道当您购买该商品时,您不是欺诈者,您不是进行欺诈的机器人,您是实际想要商品和服务的消费者,并且它将被送回家。

99% 的时间一切都很顺利。只有不到 1% 的时间,您才会遇到真正的欺诈。而这正是所有实时信息、验证和评估变得非常关键的地方。

迈克尔·克里格斯曼:那么,这一切发生的速度有多快?

埃里克·哈勒:毫秒。毫秒。实际上不到眨眼的功夫。我认为我们的一些更快解决方案将在 40 毫秒内运行。我的意思是,我试图回忆我的 Visa 时代,我曾经是一个支付领域的人,我认为通常,如果您处于零售环境中,您需要以大约 200 毫秒的速度运行。因此,大约是五分之一秒,我们将达到它的五分之一。所以,非常快。是的,我们正处于这样的环境中。

迈克尔·克里格斯曼:让我弄清楚。因此,您正在收集——对于每次交易,您都会收集数十个,甚至数百个数据点,首先验证交易者的真实性——该人,以确保这是一个真实、合法的交易。只有在这一点上,您才开始分析——收集与交易相关的真实数据,处理该数据,然后将其返回到设备。

埃里克·哈勒:是的,这取决于我们正在谈论的流程。因此,由于我们现在只专注于在线操作,而这正是大多数人现在所做的事情,因此,交易评估会在会话期间多次发生。您甚至没有意识到这一点,直到您真正点击购买该商品或您在网上进行的任何操作。

因此,从您参与的时刻起,就有一个截点。这不仅仅是——埃克斯彼瑞安从事这种工作,但行业中还有许多人从事这项工作,包括我们的客户,但当您浏览网站时,您会被观察或监控。

很奇怪,如果有人在网站上,突然想看源代码。这个网站是怎么搭建的?我想翻一下看看能不能找到它的源代码。这会是一个危险信号。正常的购物者不会这样做。比如,我从来没有做过这种事。所以这不是正常的行为。 

但从你登陆网站的那一刻到最终购买的整个过程,可能需要我们与客户反复沟通多次来评估。 

然后当你进行最终交易时,你需要提供一些信息,比如你的账号、姓名、收货地址等等,这时会进行另一次评估。这些凭证有效吗?与我们之前看到的匹配吗?会考虑到很多方面。 

最终,信不信由你,虽然这些步骤、检查、验证、对数据库进行查询、运行模型等等所有这些过程都在毫秒级完成,听起来很疯狂,但我们不想阻止任何交易,除非我们完全确信存在很大的风险。大多数情况下没有很大的风险。大多数情况下,顺利的交易流程就是成功的购买。 

我们的客户也关心这一点。他们不希望因为风险而破坏客户的体验,除非风险足够高或足够确定,以至于他们想采取行动。所以所有这些幕后工作,理论上,你可能会遇到体验卡顿或一路上被问了很多问题的情况,这对任何人都没有乐趣。每个人都喜欢在线购物的便利性。 

从某种程度上来说,如果采取这种方法,它会变得不如去商店购物方便。而这并不是世界的发展方向。世界希望让事情尽可能简单。所以它利用所有这些信息,并在后台进行验证。这让我们所有人的生活都变得更加轻松。 

另一方面,如果你没有做好,允许一笔本不应该发生的交易成功完成,而这笔交易实际上是欺诈性的,伪装成合法交易,将会付出非常高的代价。 

这就是为什么它如此重要。所以我们的客户——我们自己也经历过这些,但我们的客户也与我们一起经历这些,即评估方法本身的有效性,并评估——就像我一直说的,你通常会被你看不到的数据所欺骗。如果你要遭受欺诈,那是因为你没有分析,没有看到这些数据。 

因此,市场上的各种方法,我们采取了一种——我应该说,一种广泛的、全面的方法,我们会尽可能多地查看数据集合。事实上,在我们的环境中,我们正在构建一个平台,它只做一件事,那就是为来自各种来源的新数据提供动力——只要它被识别出来,并且可以被捕捉到,而且在法律上我们可以提取它。 

显然,这方面存在法律障碍和监管方面的限制,但假设它是可以接受的,我们会将其放入一个中心,并不断评估可能识别风险的新信号,以便我们可以将其应用于我们目前市场上提供的解决方案。 

所以你说得对。如果你做错了,你会遭受经济损失。所以目标是尽可能地保持在边缘,尽可能地捕捉数据,并确保你能在遭受攻击之前看到欺诈。 

MICHAEL KRIGSMAN: 再次强调,这是实时发生的,比这还要快。 

是的,没错。没错,我的意思是,你说得完全正确。我一直都很难——我一直都很难理解这发生的有多快。当我年轻的时候,自己写代码时,你会对更快地处理文件感到兴奋。就像你把一个文件放进去,可能要花一整晚才能运行,然后他们升级了你的系统,然后它只花了 1 个小时。 

所以,我认为,能够理解你在短时间内想要完成的任务的量级,比你现在面临的情况更容易,因为我们每天要处理数百万笔交易,而且是在毫秒级的时间范围内。也许是因为我 50 多岁了,我很难想象。我知道我们做到了,我也看到了,但这真的很神奇。 

MICHAEL KRIGSMAN: 我完全同意。这绝对令人惊叹。所以,为了避免过于技术化,数据库技术在其中扮演什么角色?你会考虑这一点吗,还是这只是后台的事情? 

ERIC HALLER: 当然。不,数据库技术已经成为事物的重要组成部分。我们是 Hadoop 的早期采用者,也是 Spark 的早期采用者。我们是许多不同数据库技术的早期采用者,以观察它们的表现。我认为有些东西,比如——我们正在谈论在线和欺诈,其中有些东西不是实时完成的,而是批处理完成的,但它会在——我们称之为边缘实时更新,它是一种身份图。 

所以,这就是将所有这些可能描述、归属于我们身份的不同数据元素匹配起来,并试图绘制出这些元素之间的概率关系。我们都熟悉社会安全号码、姓名、地址、电话号码、生日,这些是我们习惯的东西。在网络世界中,这将通过电子邮件地址、移动广告 ID、IP 地址、设备 ID 等来增强。 

所有这些部分——天哪,现在我连接到电视的加密狗,也就是 Roku 加密狗、谷歌 Chrome 加密狗或亚马逊,所有这些设备都成为了我们身份——我们家庭身份或个人身份的一个因素。所以这是批量完成的。 

我之所以提到这一点,是因为你提到了数据库技术。像 Neo4j 这样的数据库技术,可能不一定是——我会说它在每个科技行业人士的口中,但在 ID 图世界中,它实际上成为了我们的首选数据库,因为它能够计算和绘制这些关系。 

这需要大量的工作,我称之为高维空间,你试图在数据之间绘制关系,而这些关系并不存在,但你正在进行计算,以在整个数据集中建立关系,而这些关系必须被简化为我们称之为低维或密集数据的东西,这些数据存在关系。Neo4j 在这方面非常出色。 

所以,我认为数据库技术的世界正在不断发展。即使我谈论降维——希望我没有过于技术化,但数据科学家会采用很多捷径来尝试减少所需的计算量,这取决于有多少关系和多少数据,而且数据量越来越大。 

我认为数据库技术将开始学习这些技巧,让我们的生活更轻松。典型的做法是创新首先出现在个人身上,最终会进入更大的软件平台和计算机芯片,因此,部分人类智慧的自动化将实现。 

现在,个人资料比以往任何时候都更加复杂。我认为这是对数据库技术的另一个补充视角,它也将随之发展。但是的,我的意思是,我是一个在 Oracle 和 dBASE IV 出现之前长大的孩子,所以在这个不断发展和变得更智能的世界里,我是一个老手。 

我们也可以谈谈区块链,以及数据库技术。我不得不说,尽管我对区块链的学习速度很快,但我是一个缓慢的采用者,一直都是这样。我们在那个领域有一些探索,但没有采取激进的行动。我确实看到了一些——我应该说,长期潜在价值在区块链和去中心化金融中,DeFi 空间正在蓬勃发展。 

但我要说,在我看来,它更抽象一些。因为当你谈论去中心化时,更多地是关于每家企业对数据 X、Y 或 Z 进行一定数量的计算。如果你评估所有企业完成的所有工作,实际上有多少重叠。 

这就是我为什么要说它更抽象一些,因为当你开始进入区块链世界时,随着这些计算——计算漏斗随着时间的推移,在广泛的企业中,实际上可以变得更高效,那么这就有金融价值。 

你可能会说,这会产生气候影响——积极的气候——在消耗电力、能源和加热方面,这里存在可持续性价值。所以这里确实有价值,我只是认为它更长远,而且可能比运行一个直接的损益表并看到价值更抽象。 

MICHAEL KRIGSMAN: 从实时数据角度来看,你认为区块链和去中心化金融与你的交易数据一样实时吗? 

ERIC HALLER: 根据我接触到的信息,答案是否定的。但我知道它正在朝着那个方向发展。所以我不会对现在正在运营的许多许多企业说任何贬低的话。 

我认为,当很多人专注于某件事,并且投入大量资金时,很有可能这些障碍,比如区块链、实时性和高流量,一直都是障碍之一。 

我可以说,目前,去中心化金融更像是抵押贷款之类的,其中有一些部分,并且需要一些时间才能完成。 

但我不会说它有一天不会实现。那将是我说手机不会走得太远的时候,那是史蒂夫·鲍尔默,手机——我不会那样说,因为我认为那将是一个错误。 

MICHAEL KRIGSMAN: 就像你说的,当你有很多资金、很多时间,以及很多人投入精力和资源去做某件事时,很有可能在另一端会产生重要的东西。 

你谈到了数据库技术的演变。你是否考虑过云的演变,云存储、混合云、多云以及所有这些的发展方向?因为显然,这也是整个数据方程中重要的组成部分。 

ERIC HALLER: 是的,的确如此。虽然我倾向于更多地关注解决方案方面,而不是 IT 方面,但我可以告诉你我们看到它将走向哪里。混合云或多云——我有一些东西在本地运行,有一些东西在云中运行,或者有一些东西在多个云中运行。其中一些是财务游戏,其中一些是安全游戏,还有一些是——我应该说一些是财务的,一些是安全的。我将解释原因。 

所以,在多云环境中,我想确保如果我在 AWS 中开发了一些东西,我可以将其迁移到 Google 或微软的 Azure,所以我要确保这种灵活性。因此,我可能会在 Kubernetes 中构建一个容器,然后我可以将其从一个云迁移到另一个云。这就是我所说的更多的是财务游戏,对吧? 

可能是不同的东西。我可能希望能够与一家公司进行谈判,而不是另一家公司,如果我能保持一定的灵活性或可移植性,那么它就会给我一些筹码。可能还有另一个方面,那就是并非所有云在所有市场上都相同。 

有些云的性能要好得多,国际市场会说非美国和其他云。因此,您可能希望采用多云战略,就像 Experian 一样,您在很多国家开展业务,并且希望确保您有能力在任何市场提供最佳解决方案。 

所以,我认为这将是财务方面。在安全方面,取决于你是谁。我已经与很多朋友谈过,我们称他们为企业/技术,他们很欣赏位于大型云中的一些安全功能,因为他们知道这些云完全专注于安全性,并拥有最好的工具来保持安全。 

维护网络安全防御需要付出很多努力、工作和专业知识,您必须找到最优秀的人才,并且必须持续关注它。Experian 恰好是那些在确保我们处于领先地位方面投入巨资的公司之一。但是,从网络风险的角度来看,在云中存在一些价值。我认为 - 所以它存在一个风险方面。 

在财务方面再次回到这个问题,管理研发,我们做了很多本地部署,我想说,我们进行了成本分析,以确定如果我们把所有这些都放在云中,与我们本地部署相比,哪个更好,因为所有 - 我称之为计算强度,以及数据分析来回传递。我们实际上必须分析大量数据本身。因此,进进出出,进进出出都会产生开销。 

但这一切都通向哪里,这是一个不同的问题。所以这就是我们现在的状态,一切走向何方。所以我也有自己的想法 - 这更像是埃里克·哈勒的想法,而不是其他任何想法。 

所以,我想说大约六年前,我绘制了一个云市场的路线图,以及它们的发展方向,只是想弄清楚 Experian 在这一切中应该扮演什么角色。我们应该在哪里发表意见,董事会会向我征求意见,我必须有意见。 

所以,从我的角度来看,每个云提供商都必须考虑他们如何才能与众不同,而不仅仅是他们拥有更好的财务方程式等等。因此,我去了,要么是分析工具,谷歌显然已经尝试过,要么是数据,我认为 Azure 已经尝试过。 

而且,我实际上相信,随着时间的推移,云的数据方面将成为秘密武器的领域。我举个例子。您有多个业务都依附于一个云基础设施。我们谈论的是实时数据共享,也许是身份图,诸如此类的事情。 

如今,我们可能通过建立一个联盟、一群愿意合作的公司来进行这些流程,或者开发一定数量的基础设施来访问这些数据。因此,我认为在云环境中,它们天生就处于那种门户,能够推动联盟相关的事情,因为它们所处的基础设施和环境,附加值将很容易证明。 

我认为这从各个方面来说都是有利的。我不认为 - 我可以争辩说,随着时间的推移,所有这些都将带来好处。再说一次,我想这将是我的抽象想法,而不是其他任何东西。 

迈克尔·克里格斯曼:埃里克,我们一直在谈论技术。这个播客实际上是关于实时数据和创新的业务影响和消费者影响。所以,我们来谈谈数据在 Experian 创新中的作用。这些部分是如何联系在一起的?创新、实时数据和 Experian 的业务目标。 

埃里克·哈勒:有几件事。一个是 - 你可能知道这一点。我在格雷格·萨特尔的书《创新地图》中写过一章,他写了关于我们的实验室以及我们如何在实验室中创新的内容。他强调的一点是,所有创新都围绕着解决业务挑战。我首先说这一点,因为在我看来,数据的角色通常是您用来解决问题的宝藏。但它不是您进行创新的出发点,而是您用来解决特定问题的出发点。 

比如我们遍布全球的实验室,我们与我们的市场和客户群高度互动。事实上,我们衡量 - 我们有一个漏斗,从客户开始,以及我们与他们互动的频率。我们实际上衡量我们的互动水平,逐季、逐地区地衡量,因为所有想法都来自解决客户的问题。这有点像漏斗的顶端。 

当你开始进入“如何”时。当你开始进入“如何”时。所以,我有一个特定的挑战,它可能是,天哪,我正在尝试 - 我有一个欺诈问题,它是当人们使用他们的移动设备时,而且只有移动设备,并且是针对我使用的这种类型的应用程序。我的意思是,它们可以变得非常具体。它们可以变得非常抽象。 

然后,您就去寻找数据来弄清楚。您会说,好的,我能从数据中学到什么?在我们的实验室里,我们试图做到 - 我称之为“三河体育场”,所有河流都汇聚 - 但我们试图让所有来自所有业务的数据流都流向一个地方。 

这样,当需要解决问题时,我们就能获得尽可能多的数据,而且我们也知道这些数据。如果我们在解决问题的过程中认为没有正确的数据来解决问题,我们实际上有一个团队会出去与可能拥有我们所需数据的其他公司交谈,试图把这些数据拉进来。 

对于像 Experian 这样的公司来说,数据和机器学习或分析成为解决问题的燃料,这已经成为我们的第二天性。我认为最大的 - 我会说最大的限制是我们所处的监管环境。 

所以,正如我提到的,我们所有的业务,信贷业务受《公平信用报告法》管辖,汽车业务受《驾驶员隐私与保护法》管辖,甚至多个业务受《格雷厄姆-里奇-布利法》管辖,我们的医疗保健业务受《健康保险流通与责任法》管辖。我们所有的数据科学家都必须学习法律,他们会定期接受法律测试。我们的审计会到位,以确保我们遵守法律。 

所以,当我这么说的时候,也许只是为了让那些对此感到好奇的人明白,Experian 拥有大量数据,你们在用它做什么?所以我们必须通过所有这些限制,以确保当我们去解决问题时,我们可以使用尽可能多的数据,并且以合法且合规的方式做所有事情。 

但对我们来说这是第二天性。比如我可以告诉你,我们所有的流程都到位了,我们指定人员专门负责评估这些事情,但在大多数公司中情况并非如此。我认为在大多数公司中,需要花费很多努力才能建立一个环境,在这个环境中,您拥有稳定的数据流,并且您拥有了解可用数据以及他们可以使用哪些数据的员工。 

有时是人类的智慧和创造力,有时是 - 当我们 11 年前首次建立实验室时,我们构建了一个 JavaScript,它基本上将数据转换为属性。我们获取任何数据语料库,并将它们转换为数千个属性,数千个属性。 

然后 - 所以你甚至不必知道。逻辑是,你甚至不需要了解数据,让我们看看会发生什么。让我们运行它,我们将向它投入一些机器学习,也许它 - 谁知道?增强树,或者其他任何东西,但我们将看看会发生什么,然后这将指导我们的方向。 

有时这有效。有时这非常有用。有时不仅仅是这些。有时你必须考虑你想解决什么问题。我几乎把我们的一些属性称为它们本身的迷你模型,你必须考虑这一点,你才能从中获得更多。你会从葡萄中获得更多汁液。 

所以你说创新来自 - 我在这里解释 - 来自客户的挑战以及他们试图解决的客户问题,以及他们的客户目标。你根据这一点进行创新,而不是数据成为创新的来源。数据是宝藏,正如你所描述的那样。但一定有的时候,你会访问某些类型的数据,然后推动你进行创新。 

你知道,这是一个有趣的想法,因为我的直觉告诉我你是对的。但我只是在考虑我们业务中的实际应用。问题是,你希望拥有带宽来浏览这组数据,让你的心尽情发挥,看看你会得到什么。上次 - 我正在思考上次我们这样做是什么时候。 

你看,迈克尔,问题是,很多时候如果你这样做,你可能会找到百万分之一的针,找到一个赢家,但如果你追逐一个特定的问题来解决,你更有可能找到赢家。因为你知道,如果你解决了它,我的意思是,理论上有人会为此买单。这就是那里的事情。 

我只是在思考 COVID。这可能是一个领域。当大流行来袭时,我们在我们所有的实验室里做了很多关于 COVID 的工作,我们从最初的前提开始。当前的模型,SEIR 模型,IHME 模型,以及用来评估病毒传播速度和影响的模型,很重要,但我们想让它更贴近家庭经济影响。 

因为特定地理区域企业关闭,人们失业或不得不领取失业救济金,所以我们认为 Experian 处于一个有利的位置,可以帮助医院、政府、市政府、联邦政府评估全国范围内热点地区的增加。我们实际上是在多个国家做到了这一点。 

但在这种情况下,再说一次,这是一个我们认为自己可能有一个解决方案的问题,但我们的数据网络范围很广。以及数据资产 - 从 MARC 广告 - 在线广告网络中提取 GPS 数据。 

比如,你可能不会一开始就想到使用这样的东西,除非你开始并想说,好吧,人们遵守居家令的程度如何?诸如此类的事情,然后突然之间你就会使用它。如果某个地区的活动更多,我们可以建模并表明病毒会传播更多,对企业和经济造成更大的负面影响。 

在巴西,我们意识到我们没有数据来解决这个问题。我们与一家非常雄心勃勃的公司网络合作 - 我们最终与联合国和世界卫生组织合作,以及像亚马逊和微软这样的公司,像芝加哥大学这样的大学 - 即使它们在美国,它们也帮助巴西做这件事,以及像圣保罗大学和其他大学,共同构建了一个数据网络。 

因为我们没有全部掌握在 Experian 内部,但我们掌握了一些碎片,并且我们有这种雄心,那就是,世界现在需要帮助。我们应该尽自己的一份力量,最终它将反馈到我们擅长的领域,以及帮助我们的客户解决业务问题,但在这种情况下,也许那里有一个更大的画面。 

但是,这不像浏览数据那样多,更像是倾听问题。也许人类的创造力在于试图评估——就像我告诉你,这就像人类创造力的一个方面。

当我们集思广益,思考哪些数据可能有助于追踪病毒时,我的意思是,你最终会意识到一些非常具体的事情是有帮助的。比如——我们称之为社会决定因素,比如靠近公共交通。事实上,这在追踪病毒传播方面是一个非常有用的统计数据。

但在我们的头脑风暴中,我们想得非常疯狂,比如,我们可以通过九位数的邮政编码或七位数的邮政编码,查看人们购买止咳药和体温计等东西——因为他们生病了,他们会去商店购买。这是否足够——是否会告诉我们足够的信息,就像他们在进行新冠病毒检测之前的一个早期指标,表明有人生病了。顺便说一下,结果证明这没有用,你知道的,它只是噪音。

但这就是我的意思,你希望问题驱动你的网络,捕获你能够想到的或能够获取到的任何数据,然后让数据告诉你如何解决问题。这更像是一种——即使它听起来不像以数据为中心,我仍然会说这是一种以数据为中心的方法。

迈克尔·克里格斯曼:很明显,你正在关注真实的问题,并弄清楚你可以使用什么数据,或者你需要什么数据,或者你可以获取什么数据来解决这些问题。埃里克,在我们结束的时候,你提到了数据的社会效益。那么,组织、政府如何利用大规模的实时数据来造福客户、我们公民以及我们环境的社会效益呢?

埃里克·哈勒:所以,你知道,我认为你的听众来自不同的层次,不同的公司。我会告诉你,这不像大型制药公司。你知道,当我想到大型制药公司的时候,我想的是,嘿,除非你有几十亿美元花在基础设施上,否则你不会真正进入大型制药行业的。否则你不会真正进入这个行业。

而数据还没有达到那个程度。我说的是我们拥有的一切基础设施,比如我们在Experian拥有的基础设施。所以我们在这方面很幸运,我会称之为拥有这种基础设施的一流公司。

我认为,如果我正在做一家初创公司,并且我在追逐我认为我们所说的社会公益挑战,比如深度伪造——我会用深度伪造。就像你知道的,你在新闻中经常看到Experian与深度伪造有关,因为我拥有实验室,我们的欺诈和身份识别小组在深度伪造方面投入了大量的时间和精力,因为我认为这是世界面临的一项新兴挑战。我认为三年后,它将比现在更具挑战性。

如果你是一家初创公司,你仍然可以围绕深度伪造来追求一个崇高的目标。我的意思是,你必须能够说服别人加入你的战斗,让他们相信值得加入。如果你像马克·扎克伯格一样聪明,并且想出一个所有人都愿意使用的平台,那么你就拥有了你能够利用的数据——这就是梦想,对吧?如果你能够做到这一点,那太棒了。

否则,你将不得不让利益相关者加入,他们必须分享同一个梦想和愿景。我会说,尽力做好事,比如坚持合法的事情。你知道,我们得到了很多清晰的信息——我认为政府当然可以更加明确。

但我认为,你会看到一个世界趋势,即政府试图调整立法,以保护人民,但同时允许创新,并使我们的生活以积极的方式受到影响,以便继续发展。

但是的,我会说,准备好与许多其他人合作。我的意思是,从Experian这样的公司开始总是件好事。如果这是一个伟大的想法,我们经常会与其他公司一起围绕伟大的想法进行合作。但总的来说,我认为关键在于——利益相关者。

迈克尔·克里格斯曼:合作。

合作。这就是我想要说的词。这是一个更好的词。

迈克尔·克里格斯曼:埃里克·哈勒,非常感谢你。这真是一个非常有见地和鼓舞人心的对话。非常感谢你抽出时间今天与我们交谈。

埃里克·哈勒:嘿,谢谢迈克尔。我总是很乐意参加你的节目。所以谢谢。

我们一直在与Experian的埃里克·哈勒交谈。大家好,非常感谢大家的收听。请务必收看下一集。

获取如何利用数据推动业务增长的见解

您的同行也浏览了

Aerial view of a intersecting highway

电子书

金融服务中的数据创新

数字经济正在挑战银行家重新评估他们的商业模式。了解在向实时金融服务转型时出现的四种常见挑战的解决方案。

随时了解最新数据内容