“通常是你没有看到的数据会抓住你。如果你要受到欺诈的打击,那是因为你没有分析和看到的数据”
Eric Haller
EVP兼总经理,身份、欺诈和数据实验室 / Experian
Eric Haller是Experian身份、欺诈和数据实验室的EVP兼总经理,Experian是美国三大信用评级机构之一,业务遍及40多个国家,拥有超过18,000名员工。 Eric负责监督用于精确定位欺诈交易的检测算法,并负责分析EB级数据以检测欺诈交易。
金融服务公司每天都在处理大量高度敏感的信息,因此,“拥有最新的、最准确的信息对于当时做出最佳决策至关重要,尤其是在信用风险或欺诈方面”(Haller)。在本期节目中,Eric分享了实时欺诈检测的最佳实践、分析大型高速数据时要考虑的技术挑战,并为如何通过数据洞察力推动业务创新提供了建议。
在加入Experian之前,Eric曾在Sequoia Capital负责新产品,在那里他创建了第一张消费者可以在零售商处购买的信用卡。 Eric还共同创立了身份欺诈检测业务ID Analytics,该公司被LifeLock收购,现在是赛门铁克的一部分。
迈克尔·克里格斯曼:我们正在与益百利的Eric Haller讨论实时数据。 Eric,你好吗?很高兴再次见到你。
埃里克·哈勒:嗨,我也是。很高兴再次参加你的节目。
迈克尔·克里格斯曼:埃里克,给我们介绍一下益百利,以及你的角色。
当然。益百利是一家全球信息服务公司,我们在40多个国家开展业务,拥有约18,000名员工,并且涉足许多不同的行业,但你可能主要通过信用认识我们。在美国,我们拥有三大美国信用评级机构之一,面向消费者。
所以大多数人都是通过这个认识我们。但我们涉足许多不同的市场。可以是汽车、医疗保健、营销等等。我的角色是业务负责人。我是执行副总裁,我管理我们在全球范围内的身份和欺诈损益,以及我们称之为DataLabs的研发部门,我管理我们全球的DataLabs。
迈克尔·克里格斯曼:显然,实时数据对你的业务至关重要。
埃里克·哈勒:绝对是。在任何企业中,我们都会代表我们的客户在幕后做大量工作,拥有最新的、最准确的信息对于当时做出最佳决策至关重要。
尤其是在信用风险或欺诈方面,随着世界进入数字环境,能够收集、获取和分析信息,并在几毫秒内做出响应,成为该过程的关键部分。
迈克尔·克里格斯曼:那么实时性绝对至关重要?
埃里克·哈勒:是的,所以你必须从整体上考虑数据。如果你是数据领域的极客,你会将世界划分为你有时间思考的事情和你必须立即回答的事情。
所以在立即回答的世界中,其中一些信息被捕获、分析、收集并准备好。 这需要很多时间才能完成,所以一切都准备就绪,所以当您必须做出决定时,它会立即准备好并可用。 在我们的很多决定中,这都是很重要的一部分。
但也有一些决定,比如在欺诈领域以及在数字环境中,作为交易或过程的一部分捕获的实际数据,对于当时做出最佳决定绝对至关重要。 所以你正在获取当前正在发生的事情,以及你从某种历史角度了解到的事情,并对其进行分析、评分,并得出决定。
这就是我所说的实时性的核心。 许多决定是在瞬间做出的。 它变得更具挑战性和更复杂,我们需要真正发挥我们的分析和技术实力,才能实际利用作为该过程一部分捕获的信息,其中该信息是评分机制或机器学习过程的一部分,以得出正确的决定。
迈克尔·克里格斯曼:那么,从高层来看,实时性对你业务的某些部分至关重要,更重要的是你的客户正在做什么。 我们在讨论多少数据? 你运作的规模是什么样的?
埃里克·哈勒:嗯,再说一次,查看数据的方式确实不同。 所以像在研发中,我们很乐于利用大型数据集,TB级的数据。 我认为总的来说,我们的四个实验室可能经常处理大约一个EB的数据,四个实验室大约是1,000 PB。 所以我们习惯于使用大量数据。 但这通常是在你分析大量信息以尝试提取出你可以利用的某些行为时。 比如,嘿,这是一个以前从未在非洲放贷过的人群。 那么我们可以捕获多少信息,以便我们可以提取信号,以便我们可以了解如何向他们贷款?
在您所谈论的实时环境中,有效负载较小,但非常简洁。 就像每个数据元素都很重要一样。 所以数据量不大。 即使是 1,000 字节的数据,听起来也不多,因为那里有很多信息你需要尝试做出决定。
实时环境中数据量可能不如传入信息的广度那么大,我会给你一个例子。 因此,作为消费者,你正在互联网上购买你的商品,你已经完成了整个过程,你到达了购物车。
你可能没有意识到的是,幕后实时发生了很多事情。 这可能是因为,嘿,我们正在查看你正在使用的设备。 并且存在信息,捕获的特征只是一个设备通过互联网与另一个设备通信的一部分,并且他们说,我们以前见过这个设备吗?
你设备上的传感器会捕获你执行某项操作的速度。 如果你在移动设备上,你可以在屏幕上同时触发多少像素。 信不信由你,这些信息实际上对于了解你是否是真人还是机器人非常有洞察力。
你知道,机器人可能在几乎不在手机上触发任何像素的情况下发送信息——作为消息的一部分,它可能会触发一两个像素,我们知道手指触摸屏幕至少会触发 110 个像素。 因此,捕获的是此类信息。 它很小,但非常有意义。 我可能——
我不知道你的眼睛是否会呆滞,你是否会发现我们在此在线过程中捕获的所有不同方面的数据令人着迷,只是为了验证你是一个真正的人,希望我们以前与你合作过,我们的客户以前与你合作过,并且有一定的舒适度,知道当你购买该商品时,你不是一个欺诈者,你不是一个实施欺诈的机器人,你是一个想要商品和服务的真实消费者,并且它将被送到家中。
99% 的情况下一切都很好。 只有 1% 或不到 1% 的时间,你才在处理实际的欺诈。 而这正是所有实时信息、验证和评估变得非常关键的地方。
迈克尔·克里格斯曼:所有这一切发生得有多快?
埃里克·哈勒:毫秒。 毫秒。 确实不到眨眼的时间。 我认为我们的一些更快的解决方案将以 40 毫秒的速度运行。 我的意思是,我正在回忆我的签证时代,我曾经是一个支付人员,我认为通常情况下,如果你在零售环境中,你需要以大约 200 毫秒的速度运行。 也就是说大约五分之一秒,我们将完成五分之一秒。 所以,非常快。 是的,这就是我们所处的环境。
迈克尔·克里格斯曼:所以让我弄清楚一下。 因此,对于每笔交易,你都会收集数十甚至数百个数据点,首先验证交易者的身份,以确保它是真实的、合法的交易。 只有在那时,你才开始分析——收集与交易相关的真实数据,处理该数据,然后将其返回到设备。
埃里克·哈勒:是的,这取决于我们正在谈论的过程。 因此,由于我们现在只是热衷于在线进行操作(现在大多数人都在这样做),因此事务性评估在一个会话期间会多次发生。 在你实际点击在线购买此商品或你正在做的任何事情之前,你甚至都不知道这一点。
所以从你参与的那一刻起就有一个削减。 这不仅仅是——益百利在做这类工作,但行业内也有很多人在做这件事,包括我们的客户,但当你浏览网站时,你将会被关注或监视。
如果有人浏览网站,突然想要查看源代码,这很奇怪。这个网站是怎么搭建的?我想翻过去看看我能不能找到它的源代码。这会是一个危险信号。正常的购物者不会这样做。比如,我从来没有这样做过。所以这不是一种正常的行为。
但是,从你登陆一个网站到最终购买商品的过程中,为了评估,你可能会在我们客户和我们之间来回多次。
当你到达最终交易环节,并提供一些信息——账号、姓名、收货地址,以及其他类似的信息时,这会进入另一个评估阶段。这些凭证是否有效?是否与我们之前看到的信息匹配?会考虑到很多方面。
最终,信不信由你,尽管所有这些环节、检查、验证,以及与数据库比对、运行模型等操作,都在毫秒级的时间内完成,听起来很疯狂,但除非我们绝对确信存在很大风险,否则我们不想阻止任何事情。大多数情况下,风险并不高。大多数情况下,购买过程都很顺利。
这也是我们的客户所关心的。他们不想因为风险而打断客户体验,除非风险足够高或足够确定,他们才会采取行动。所以所有这些幕后工作——理论上,你的体验可能会断断续续,或者你会被问很多问题,这对任何人来说都不好玩。每个人都喜欢在线购物的便利。
如果你采取那种方法,在线购物的便利性在某些方面甚至会低于去商店购物。而且世界的发展趋势不是这样的。世界希望尽可能地简化流程。所以,关键在于利用所有这些信息,并在幕后进行验证。这让我们的生活变得更加轻松。
另一方面,如果你处理不当,允许一笔不应该通过的交易通过,因为这实际上是欺诈行为,伪装成合法交易,那么代价会非常高。
这就是它如此重要的原因。所以我们的客户——我们自己会经历这些流程,但我们的客户会和我们一起经历这些流程,也就是评估方法本身的有效性,并评估——正如我常说的,通常是你看不到的数据会抓住你。如果你要遭受欺诈,那是因为你没有分析、没有看到的数据。
因此,在市场上存在的各种方法中,我们采取了一种非常广泛、全面的方法,尽可能多地查看数据集。事实上,在我们的环境中,我们正在构建一个平台,它只做一件事,那就是接收来自各个渠道的新数据——如果这些数据已经被识别并可以被捕获,并且在法律上我们可以获取它。
显然,这里面存在法律障碍和监管问题,但假设一切都合规,我们就会将这些数据放入一个中心,并不断评估可能识别风险的新信号,以便我们可以将这些信号传递给我们在当今市场上提供的解决方案中的客户。
所以你是对的。如果你处理不当,你将会遭受经济损失。因此,目标是尽可能地保持在该领域的前沿,即捕获数据并确保在遭受攻击之前能够发现欺诈。
MICHAEL KRIGSMAN:再次强调,这是实时的,而且速度比你说的还要快。
是的,没错。我一直很难理解这些发生的速度。当我年轻的时候,我自己编写代码,当你能更快地处理一个文件时,你会感到兴奋。比如,你放入一个文件,可能一个月要花你整晚的时间来运行,然后他们升级了你的系统,只需要一个小时了。
因此,能够理解你试图以快速的速度完成的事情的规模的想法,我认为比现在我们每天在毫秒级的时间内处理数百万笔交易的情况更容易理解。也许是因为我已经50多岁了,我很难想象它。我知道我们正在这样做,而且我看到了它,但它确实令人惊叹。
MICHAEL KRIGSMAN:我完全同意。这绝对令人惊叹。所以,为了不变得太技术化,数据库技术在哪里发挥作用?你会考虑这个问题吗,还是这只是后端的事情?
ERIC HALLER:当然。不,数据库技术已经成为重要的一部分。我们是Hadoop的早期采用者,也是Spark的早期采用者。我们是许多不同数据库技术的早期采用者,看看它们是如何发挥作用的。我认为有几件事——所以我们正在谈论在线和欺诈,其中一件不是真正实时完成的事情,它是批量完成的,但在边缘上实时更新,我们称之为身份图谱。
这就是匹配所有这些不同的数据元素,这些数据元素可能会描述、归因于我们的身份,并试图在它们之间建立概率关系。我们都熟悉社会安全号码、姓名、地址、电话号码、生日,这是我们过去常用的。在网络世界中,这些信息可能会被电子邮件地址、移动广告ID、IP地址、设备ID所增强。
所有这些信息——天哪,甚至现在连接到我电视上的那个适配器,无论是Roku适配器还是Google Chrome适配器,还是亚马逊的适配器,所有这些设备都成为我们身份的一个因素——我们的家庭身份或个人身份。而这都是批量完成的。
我之所以提到这一点,是因为你提到了数据库技术。像Neo4j这样的数据库技术,可能不一定被所有技术人员所熟知,但在ID图谱领域,它实际上成为了我们的首选数据库,因为它能够计算和绘制这些关系。
这是一个非常大的工作量,我称之为高维空间,你试图在数据之间建立关系,即使这些关系并不存在,但你正在经历在你的整个数据集中建立关系的运作,并且必须将其简化为我们称之为低维度或密集数据,即存在这些关系的地方。Neo4j在这方面非常擅长。
所以我确实认为数据库技术领域肯定在不断发展。即使我谈论的是降低维度——希望我没有变得太技术化,但作为一名数据科学家,为了减少所需的计算工作量,人们会采取很多捷径,具体取决于关系的数量和数据的多少,而且数据只会越来越大。
我认为数据库技术本身将开始采用这些技巧,使我们的生活更加轻松。通常的模式是,创新始于个人,最终会融入到更大的软件平台和计算机芯片中,因此,对某些人类智慧的自动化将会发生。
现在,个人资料正变得比以往任何时候都复杂得多。我认为这是数据库技术的另一个补充视角,它也将随之发展。但是,是的,我是一个在pre-Oracle和dBASE IV时代长大的孩子,所以在这个不断发展和变得更智能的世界里,我是一个老前辈。
我们也可以稍微谈谈区块链,以及数据库技术。实际上,我必须说,即使我很快就学会了区块链,但我仍然是一个缓慢的采用者。我们在这个领域稍微尝试了一下,但并不积极。我确实看到区块链和去中心化金融(DeFi)领域具有一些长期潜力,这个领域正在蓬勃发展。
但我会说,在我看来,它确实有点抽象。因为当你谈论去中心化时,更多的是关于每个企业都会对数据X、Y或Z进行一定数量的计算。如果你评估所有企业所做的所有工作,就会发现实际上存在多少重叠。
这就是为什么我说它有点抽象,因为当你开始进入区块链世界时,随着时间的推移,那些计算——那个计算渠道可能会在广泛的业务范围内变得更加高效,那么这就会产生经济价值。
你可能会说,这会产生气候影响——一种积极的气候——在消耗电力和能源以及升温方面,它具有可持续性价值。所以它确实具有价值,我只是认为它比立即运行损益表并看到其中的价值更长期,也可能更抽象。
MICHAEL KRIGSMAN:从实时数据的角度来看,你认为区块链和去中心化金融像你的交易数据一样是实时的吗?
ERIC HALLER:就我所知,答案是否定的。但我知道它正在朝着这个方向发展。所以我不会对现在正在运行的众多企业说任何贬低的话。
我确实相信,当很多人专注于某件事并投入大量资金时,很有可能会出现一些重要的东西,而像区块链、实时和高容量这样的障碍一直是其中的一个。
我现在可以说,去中心化金融可能更像抵押贷款之类的东西,它有很多部分,并且需要花费一些时间才能完成。
但我不会说它永远不会实现。如果我说移动电话不会走得很远,那就是我的时刻,就像史蒂夫·鲍尔默说移动电话——我不会那样说,因为我认为那将是一个错误。
MICHAEL KRIGSMAN:正如你所说,当你有大量的资金和大量的时间,并且人们投入精力和资源去做某事时,有很大的可能在另一端会出现一些重要的东西。
你刚才谈到了数据库技术的发展。你会考虑云、云存储、混合云、多云的发展以及它们将走向何方吗?因为很明显,这也是整个数据等式的重要组成部分。
ERIC HALLER:是的,确实如此。虽然我更倾向于解决方案方面,而不是IT方面,但我会告诉你我们看到它将走向何方。所以混合云或多云——我在本地做一些事情,我在云端做一些事情,或者我在多个云端做一些事情。其中一些是财务游戏,一些是安全游戏,还有一些——我只能说一些是财务的,一些是安全的。我会解释原因。
所以在多云环境中,我想确保如果我在AWS中开发了一些东西,我可以将其转移到Google或Microsoft的Azure,所以我想要这种灵活性。所以我可能会在Kubernetes的容器中构建一些东西,然后我可以将其从一个云转移到另一个云。这就是我说的,更多的是财务游戏,对吧?
可能会有不同的情况。我可能想能够与一家公司就另一家公司进行谈判,如果我可以保持一些灵活性或可移植性,那么它会给我带来一些优势。这方面可能还有另一个方面,那就是并非所有的云在所有市场上都是一样的。
有些云表现更好,国际市场会说非美国和其他云。所以您可能需要采用多云策略,就像益百利一样,因为您在许多国家都有业务,并且希望确保您有能力在您所在的任何市场提供尽可能最好的解决方案。
所以,我想说,这就是财务方面。在安全方面,这取决于您是谁。我和很多人聊过,我们称他们为“业务/技术”,他们欣赏在大型云中使用的安全功能,因为他们知道这些云完全专注于安全,并拥有最好的工具来保持安全。
维护网络安全防御需要大量的努力、工作和专业知识,您必须拥有最优秀的人才,并且必须始终保持警惕。益百利恰好是其中一家公司,我们投入大量资金以确保我们在该领域保持领先地位。但从网络风险的角度来看,使用云是有一些价值的。我想说——所以这里有一个风险方面的考虑。
再说财务方面,回到前面,管理研发,我们在本地做了很多工作,我刚刚做了成本分析,看看如果我们在云端完成所有这些工作,或者我们在本地完成这些工作,考虑到所有的计算强度和来回的数据分析,哪种方式对我们更有利。实际上,我们必须分析很多数据本身。所以进进出出都需要花费成本。
但这一切会走向何方,这是个不同的问题。这就是我们现在的处境,这一切的走向。所以我个人有自己的看法——这更多的是埃里克·哈勒的个人观点,而不是其他任何东西。
我想说,大约六年前,我做了一张云的市场地图,以及它们的发展方向,只是想弄清楚益百利在这一切中应该扮演什么角色。我们应该有什么看法,董事会会问我的看法,我必须要有自己的看法。
所以在我看来,每个云提供商都必须考虑他们差异化的能力,而不仅仅是依靠他们是更好的财务方案或其他什么。所以我认为,要么是分析工具(谷歌显然已经尝试过了),要么是数据(我认为Azure已经尝试过了)。
我实际上相信,随着时间的推移,云的数据方面将变得更加像秘密武器。我举个例子。您有多个业务都与同一个云基础设施对齐。我们讨论的是实时数据共享,讨论的可能是身份图,以及诸如此类的东西。
今天,我们可能会通过开发一个联盟,一组愿意一起工作的企业,或者您开发一定数量的可以访问该数据的基础设施来完成这些过程。所以我认为在云环境中,它们自然地站在通往启动联盟相关事物的大门前,由于它们的基础设施和环境,因此很容易证明其附加值。
我认为这对所有人来说都是额外的好处。我不认为——我可以争辩说随着时间的推移,这会带来所有额外的好处。再说一遍,我想这更多的是我抽象的想法,而不是其他任何东西。
MICHAEL KRIGSMAN:埃里克,我们一直在谈论技术。这个播客实际上是关于实时数据和创新对业务的影响,对消费者的影响。所以让我们谈谈数据在益百利创新中的作用。那么这些部分是如何连接的?创新、实时数据和益百利的业务目标。
ERIC HALLER:有几件事。一个是——您可能已经意识到了。我写在格雷格·萨特尔(Greg Satell)的一本书《绘制创新》(Mapping Innovation)中,他写了一个关于我们实验室以及我们在实验室中如何创新的章节。他特别指出的一件事是,所有创新都围绕着解决业务挑战。我首先要说的是,在我看来,数据的角色通常是您利用来解决问题的宝藏。但它不是您进行创新的首选,而是您解决特定问题的首选。
就像我们在全球的实验室一样,我们与我们的市场和客户群保持着高度的互动。事实上,我们衡量——我们有一个漏斗,从我们的客户开始,以及我们与他们互动的频率。我们实际上衡量了我们的参与程度,一个季度又一个季度,一个地区又一个地区,因为所有的想法都来自解决我们客户的问题。这是漏斗的顶部。
当您开始深入研究“如何”时。当您开始深入研究“如何”时。所以我面临一个特殊的挑战,可能是,天啊,我正在尝试——我遇到了一个欺诈问题,而且是当人们使用他们的移动设备时发生的,而且只发生在移动设备上,而且只针对我正在使用的这种应用程序。我的意思是,它们可能非常具体。它们也可能非常抽象。
然后您会查看数据以尝试找出答案。您会想,好吧,我可以从数据中学到什么?在我们的实验室中,我们尝试做的是创建——我将其称为像“三河体育场”,所有的河流都汇聚——但我们尝试将来自所有业务的所有数据流汇聚到一个位置。
这样,当需要解决问题时,我们就可以获得尽可能多的数据,我们知道的数据。如果我们在解决问题时认为我们没有正确的数据来解决它,我们实际上会有一个团队出去与其他可能拥有我们需要的数据的公司交谈,试图将其拉入。
对于像益百利这样数据和机器学习或分析成为解决问题的燃料的公司来说,这几乎成为我们的第二天性。而最大的——我想说最大的护栏是我们所处的监管环境。
就像我提到的我们所有的业务一样,信用业务有《公平信用报告法案》(Fair Credit Reporting Act),汽车业务有《驾驶员隐私保护法案》(Driver’s Privacy and Protection Act),甚至多个业务都有《格雷姆-里奇-比利雷法案》(Gramm-Leach-Bliley Act),我们的医疗保健业务有《健康保险流通与责任法案》(HIPAA)。我们所有的数据科学家都必须学习法律,他们会定期接受法律测试。我们的审计也在进行,以确保我们遵守法律。
所以当我说所有这些时,也许只是以防万一有人对此感到好奇并想知道,益百利有很多数据,您用这些数据做什么?因此,我们必须通过所有这些护栏,以确保当我们去解决问题时,我们会使用尽可能多的数据,并且我们以合法合规的方式进行所有操作。
但这对于我们来说是第二天性。我可以告诉您,凭借我们拥有的所有流程,我们会指定专门的人员来评估这些事情,但在大多数公司中,情况并非如此。我认为在大多数公司中,需要做很多工作才能建立一个拥有稳定数据流的环境,并且人们知道哪些可用,他们可以使用哪些。
有时是人类的聪明才智和创造力,有时是——当我们11年前首次启动我们的实验室时,我们构建了一个JavaScript,基本上是将数据转换为属性。我们将任何数据语料库转换为数千个属性,数千个属性。
然后——所以您甚至不必知道。逻辑是,您甚至不需要了解数据,让我们看看会弹出什么。让我们运行它,我们将使用一些机器学习,也许是——谁知道?提升树,或者其他什么,但我们将看看会弹出什么,然后这将指导我们的方向。
有时这有效。有时这非常有帮助。有时不仅仅是这样。有时您必须考虑您试图解决的问题。我几乎称我们的一些属性就像它们本身就是微型模型,您必须仔细考虑,这样您才能从中获得更多收益。您可以从葡萄中榨取更多果汁。
所以您说创新来自——我在这里解释一下——来自您客户的挑战和他们试图解决的客户问题,以及您客户的目标。您正在此基础上进行创新,而不是将数据作为创新的来源。正如您所描述的,数据是宝藏。但肯定会有一些时候,您可以访问某些类型的数据,然后这会刺激您推动创新。
您知道,这是一个有趣的问题,因为我的直觉告诉我您是对的。但我只是在考虑我们业务中的实际应用。问题是您希望有足够的带宽来让您尽情地研究这些数据集,看看您能得出什么结论。上次——我正在努力回想我们上次这样做是什么时候。
迈克尔,问题在于,很多时候,如果您这样做,有时您可能会在百万分之一的几率中找到一个获胜者,但如果您正在追逐一个要解决的特定问题,您更有可能找到获胜者。因为您知道如果您解决了它,我的意思是,理论上会有人为此付费。这就是问题所在。
我正在思考 COVID。这可能是一个领域。当疫情爆发时,我们在我们所有的实验室中做了很多关于 COVID 的工作,我们提出了最初的假设。目前的模型,SEIR 模型,IHME 模型,以及用于评估病毒传播速度和影响的模型非常重要,但我们希望使其更贴近经济影响。
因为特定地区的企业倒闭,人们失业或不得不申请失业救济金,所以我们认为益百利可以很好地帮助医院、政府、市政府、联邦政府评估全国热点地区的形成。我们实际上在多个国家/地区都做了这件事。
但在那种情况下,同样,这是一个我们认为可能有解决方案的问题,但我们的数据网撒得很广。以及来自 MARC Advertising——在线广告网络的数据资产中的 GPS 数据。
您可能一开始不会想到使用类似的东西,除非您已经开始并想说,好吧,人们遵守居家令的程度如何,然后您突然使用了它。如果某个地区的活动增加,我们可以建模并显示该病毒将传播更多,并且会对企业和经济产生更大的负面影响。
在巴西,我们意识到我们没有数据来解决问题。我们参与了一个非常雄心勃勃的公司网络——我们最终与联合国和世界卫生组织以及像亚马逊和微软这样的公司,以及像芝加哥大学这样的巴西大学合作——即使它们在美国,它们也帮助了巴西,以及像圣保罗大学等其他大学,以建立一个数据网络。
因为我们并没有在益百利内部拥有所有的数据,但我们拥有其中的一部分,并且我们有这样一个雄心壮志,即世界现在需要帮助。我们应该尽自己的一份力量,最终它会反馈到我们擅长的领域,帮助我们的客户找出业务问题,但在这种情况下,可能有一个更大的图景。
但同样,这不像尽可能多地浏览数据,而是倾听问题。也许人类的创造力在于尝试评估——就像我会告诉您,这是人类创造力的一个方面。
当我们集思广益哪些数据可能有助于追踪病毒时,我的意思是,您最终会意识到一些非常具体的事情是有帮助的。比如——我们称它们为社会决定因素,比如靠近公共交通。实际上,这是一个非常有用的统计数据,可以用来追踪病毒的传播。
但在我们的头脑风暴中,我们想到了一些疯狂的想法,比如,能不能看看按九位邮编或七位邮编来分析人们购买止咳糖浆和温度计之类的东西——因为他们生病了,所以去商店购买。这是否足以提前预警,比如在他们进行新冠检测之前,就能知道有人生病了。顺便说一句,结果证明这并没有什么用,只是噪音而已。
但我想说的是,你要让问题驱动你的网络,捕捉你能想到的或可以访问的任何数据,然后让数据告诉你如何解决问题。这更像是一种——即使听起来不像以数据为中心,但我会说这是一种以数据为中心的方法。
MICHAEL KRIGSMAN:很明显,你们正在关注实际问题,并找出哪些类型的数据是可用的,或者你可能需要或能够获得哪些数据来解决这些问题。埃里克,在结束时,你谈到了数据的社会效益。那么,组织、政府如何利用大规模的实时数据来造福客户、我们公民,以及我们环境的社会效益呢?
ERIC HALLER:你知道,我想你的听众来自不同的层面,来自各种不同的公司。我可以告诉你,这不像大型制药公司。当我想起大型制药公司时,我会想到,除非你花费几十亿美元用于基础设施,否则你根本无法真正进入大型制药公司的游戏。
而在数据方面,情况还不是这样。我说的是我们在益百利拥有的所有基础设施。所以我们在这一方面非常幸运,我把它称为拥有一流基础设施的一级公司。
我想,如果我正在创办一家公司,并且正在追求我们所说的社会公益挑战,比如深度伪造——我就拿深度伪造来说。你知道,你经常在新闻中看到益百利关于深度伪造的消息,因为我的实验室以及我们的欺诈和身份识别小组投入了大量的时间和精力进行思考,因为我认为这对世界来说是一个新兴的挑战。我认为三年后,它将比现在更具挑战性。
如果你是一家初创公司,你仍然可以为了一个关于深度伪造的崇高目标而奋斗。我的意思是,但你必须能够说服其他人加入你的战斗,让大家觉得值得参与进来。如果你像马克·扎克伯格那样才华横溢,并且提出了一个每个人都争相使用的平台,那么你就可以获得数据——那是梦想,对吧?如果你能做到这一点,那就太棒了。
否则,你将需要让利益相关者加入,他们必须分享同样的梦想和愿景。我想说的是,尽量做好事,坚持合法。你知道,我们有很多清晰的认识——我认为政府当然可以更明确。
但我认为你将会看到一个世界趋势,即政府试图适当调整立法,以保护人民,但允许创新和我们的生活以积极的方式受到影响并继续发展。
是的,这就是我想说的,准备好与许多其他人合作。我的意思是,从像益百利这样的公司开始总是一件好事。如果这是一个很大的想法,我们会一直与其他公司合作进行一些大项目。但总的来说,我认为关键是——利益相关者。
MICHAEL KRIGSMAN:合作。
合作。这就是我在寻找的词。这是一个更好的词。
MICHAEL KRIGSMAN:埃里克·哈勒,非常感谢你。这是一次非常有见地和鼓舞人心的对话。非常感谢你抽出时间今天和我们交谈。
ERIC HALLER:嘿,谢谢你,迈克尔。我一直很喜欢参加你的节目。谢谢你。
我们一直在和益百利的埃里克·哈勒交谈。感谢大家的收听。请务必查看下一集。
电子书
数字经济正在挑战银行家重新评估其业务模式。了解在向实时金融服务转型时出现的四个常见挑战的解决方案。