“数据处于核心地位,因为您必须了解您的客户以及他们正在寻找什么解决方案,以便提供定制的个性化服务。”
Shy Chamala
HPE/ HP 企业数据分析和数字技术主管
MICHAEL KRIGSMAN:今天我们与 Shy Chalakudi 谈话。她是 HPE 的企业数据分析和数字技术主管。
HPE 是一家庞大的公司,今天我们将讨论数据的生命周期,数据在数字转型和更广泛的组织转型中所起的作用。你好,Shy。今天过得怎么样?
SHY CHALAKUDI:迈克尔,太好了,你呢?
MICHAEL KRIGSMAN:Shy,我很好。在我们开始之前,您最近的季度怎么样?
SHY CHALAKUDI:哦,迈克尔,我们度过了一个非常棒的季度,2021 年也很出色。我们在所有指标方面都超出了预期。我们的其他增长按顺序增长了 9%,比上期增长了 28%。
我们的净收入为 74 亿美元,按顺序增长了 7%。如果您谈论我们的资产服务 ARR,为 7.96 亿美元,同比增长了 36%。坦率地说,这是继 COVID 之后、经历了我们所有人都在适应的重大变革之后,我们度过的一年。我为 HPE 在 2021 年所取得的成就感到非常自豪。
MICHAEL KRIGSMAN:Shy,恭喜您取得了如此优异的成绩。现在,您是企业数据分析和数字技术主管,这个职位意味着什么?这个职位包括什么?
SHY CHALAKUDI:我非常高兴能够担任这个企业角色,并为此付出努力。基本上,迈克尔,想想看,就是将我刚刚向您解释的商业模式内部化。
确保我可以为公司推动以数据为先的现代化。我们希望确保,安东尼奥的最大目标是让我能够让数据引领我们的数字转型,而我和我的团队就是在我职责范围内的工作。
我最大的愿景是创建一个统一的数据源,不一定是物理数据源,而是一个虚拟化的统一数据源,我的所有利益相关者都可以访问。我的内部客户和外部客户都能够从一个单一的事实来源获取数据。
好吧,这个愿景说起来容易做起来难。如果你想想 Gartner 告诉我们的,公司 80% 的时间都花在数据处理上,我们也不例外。
确保您的数据得到有效管理,您从数据中获得元数据,数据血缘关系、数据分析、数据质量,所花费的时间真是不少。我可以继续谈论管理数据所需的治理,而这主要是我组织的任务。
我的团队成员兢兢业业,他们致力于确保我们创建一个复杂、自动化、简化的数据视图,内部和外部客户都可以使用。
这就是我们数字转型的关键,因为数据将推动洞察力,帮助企业推动数字转型。
MICHAEL KRIGSMAN:Shy,你说了一件很重要的事,即使用数据来支持数字转型是您的首席执行官推动的举措。
SHY CHALAKUDI:绝对是,迈克尔。如果你看一下我们的商业模式,安东尼奥一直很清楚地表示我们正在转型成为一家以服务为中心的订阅模式公司。
今天,如果您看看您的手机、Sage,甚至是您家里的电费使用情况,您可能已经习惯了按使用付费的模式,而这就是客户的要求。
因此,这是安东尼奥正在推动的我们最大的转型之一。但这美妙之处在于,我们不仅仅将我们的计费模式从每月订阅或每年订阅改为按使用付费,而且,在进行这种转变时,我们希望确保我们能够为客户提供解决他们问题的解决方案。
不仅仅是像以往一样提供产品或服务。因此,这是我们对商业模式的最大转变之一。而数据处于核心地位,因为您必须了解您的客户,您必须了解他们正在寻找什么解决方案,以便提供定制的个性化服务。
因此,我们全新的商业模式都是由以数据为先的思维模式驱动的,即让数据引领数字转型。这使得所有这些以数据为中心的转型变得更加令人兴奋。
MICHAEL KRIGSMAN:因此,数据是数字转型的核心,而这对于 HPE 来说是目前非常基础的东西。您能举例说明一下,您如何利用数据来密集地支持您刚才描述的目标?
SHY CHALAKUDI:当然可以。我可能会举一个我们都能理解的更通用的用例。当然,我们身处科技行业,我们确实有特定的用例,如果时间允许,我们可以谈谈。但最通用的用例是了解您的客户。
更常见的说法可能是行业将其称为客户 360,即了解客户的全部范围。如果你从 HPE 的角度来看,就像我说的,我们为您的服务器需求、存储需求、企业需求、网络需求、软件需求、咨询需求等提供解决方案。
因此,能够从这些不同的指标、这些不同的角色和档案中了解客户,并了解他们的整个旅程。
我希望能够了解我的客户与我们互动时的每一步,从他们可能开始访问网站查询、进行销售电话,到与我们的支持人员进行支持电话,将所有这些信息整合到一个单一窗口,为我们所有的业务部门提供了巨大的价值,包括我们的服务团队成员、营销团队成员、销售团队成员。
我认为,这是我们非常专注于的一个重要举措。这与我们的品牌价值观也相一致。迈克尔,如果你想想 HPE 的品牌,就是客户服务、客户互动、尊重客户权利。因此,我认为这是我们自然而然的事情。但这是我们为推动数字转型而专注于的、以数据为驱动力的最大举措之一。
MICHAEL KRIGSMAN:因此,当您谈论客户互动,并利用数据来更好地了解客户并为他们提供更好的服务时,您指的是哪些数据?
SHY CHALAKUDI:有趣的问题。所有类型的数据都是通用答案。但如果你剥开洋葱,就是关于查看主数据和交易数据。
我们跟踪客户的整个生命旅程,坦率地说,即使在他们成为我们潜在客户之前。因此,数据从销售前的角度开始,一直到销售,然后是售后服务。
就像我说的,我们的品牌也专注于售后服务。我们与客户建立了长期的关系,因此数据是从端到端的角度流动的,迈克尔。
其中大多数是混合数据,销售方面可能更多是结构化数据。但对于销售前,我们关注的是正在发生的行业趋势,我们收集社交数据。
这个客户的当前需求是什么?他们在谈论什么最大的问题?我们通过社交数据来识别这一点,这些数据主要是我们也需要处理的非结构化数据。
然后我们还会查看客户情绪和客户分析,这些数据来自我们拥有的各种监听渠道,这些数据可能是非结构化数据。
然后,当涉及到销售部分时,我认为,只需将其视为从代码到现金的过程,我们能够生成交易的能力——这就是我们数据的核心所在,它是我们管理的、高度安全和受监管的数据集,用于支持客户通过销售流程的旅程。
然后我们进入售后服务阶段,我认为,这里又是混合数据。因为当涉及到服务渠道时,主要是语音数据。
所以我们正在研究将语音转换为结构化数据。或者当你查看图像时,因为我们跟踪我们在客户地点实施的产品图像,所以这又是更多无结构化数据,我们试图将图像转换为无结构化数据。所以数据是一个混合体,但主要关注的是可以帮助我们更好地服务客户的交易数据。
迈克尔·克里格斯曼:而这些交易数据基本上涵盖了整个客户旅程,我认为,所有客户可能与惠普之间的互动。
希·查拉库迪:绝对的。而且我们还因为是一家科技公司,因为我们有使用自己产品的优势,我们非常非常乐于尽可能多地收集数据。
我坚信,作为一名数据负责人,你必须选择你的数据,当然之后你还要对其进行清洗,选择你需要为客户提供服务的信息,但你绝不能限制自己尽可能多地收集数据的能力。
说实话,在这方面我们有点贪婪。我们尽可能地收集所有数据,然后使用我们需要的部分,但我们绝不停止收集从客户角度来说我们需要的所有数据。
迈克尔·克里格斯曼:一个重要的问题是,你如何将你收集到的这些数据与支持客户度过整个生命周期的业务决策联系起来?这似乎是许多组织难以处理的缺失环节。
希·查拉库迪:绝对的。再说一次,如果我正确地编写代码,有一种说法是你可以使用 AI/ML,或者你可以创建这种个性化,或者你可以响应更好的客户体验。
但你说的很对,迈克尔,如果你无法清楚地阐明和绑定这种依赖关系,这就是你的数据治理进入视野的地方,我的团队正狂热地专注于此,我们在业务合作伙伴中确实有数据管理员,我们调用他们帮助我们连接数据的业务语言。
但我认为,工具和流程的自动化有助于我们进行数据分析、数据血缘关系分析,并贯穿整个旅程连接数据的主要方面,这就是我们投入大部分时间的地方。
我认为这既涉及工具也涉及流程,两者必须协同工作。我通常会调侃我的团队,说这有点像特性,你必须制定治理策略,你必须制定严格的策略来规定如何使用这些数据以及如何连接这些数据。对此没有例外。
我非常重视这一点,如果需要,我毫不犹豫地使用我的“棍子”。但你也要在客户使用方面给予认可。
因此,我们确实有很多联邦数据源,我们允许业务人员自己体验数据,发现数据的新元素,这会让他们保持参与,并不断强化为什么要在定义数据治理策略方面进行前期投资。这对我们来说是一个阴阳相生的过程,两者相辅相成。
迈克尔·克里格斯曼:希,你一直在讨论,我们应该说,业务数据、交易数据,帮助你更好地了解客户并更好地服务他们。那么你部署给客户的软件和技术产生的遥测数据呢?
希·查拉库迪:哦,天哪,你触及了我们在这里做的事情的核心,迈克尔。是的,我们以客户为中心,客户数据对我们很重要,但是,天哪,遥测数据对我们来说很有趣。
如果你真的考虑遥测,它来自希腊语。Tele 和 mitron 非常简单,tele 意思是远程,mitron 意思是测量。这不是什么新科学或新领域,遥测已经存在很长时间了,机器一直被用来生成数据。
但我认为,现在这个时代重要的是这些机器产生的数据量。机器越来越复杂,尤其是我们部署到客户空间的机器,它们都是非常智能的机器。
它们不仅会生成数据,并向我们提供有关它们行为的指示和线索,而且它们还可以自我修复。它们还可以理解并在其中嵌入 AI/ML 来推测将要发生的事情,并预测和应对。
因此,我们必须了解这些机器的行为,我们收集了大量的遥测数据。我可以告诉你,如果你跟任何人谈论遥测,他们会告诉你的第一个最大挑战就是存储问题,因为机器比我们生成的数据多得多,而且一直在不断地从它们那里获取信息。
说实话,我的团队花了不少时间才能有效地管理这些数据,对数据进行切片,我们如何从数据中获得趋势,我们如何确保不会仅仅因为存储这些数据而承担负担。
但我们一直在不断地处理数据,以了解并改进我们可以构建的东西。这绝对是我们关注的重点,也是一个有趣的地方,我们一直在不断学习,哦,天哪,我们从越来越多的人那里了解到遥测的用法。
迈克尔·克里格斯曼:好吧,过一会儿我想谈谈你用于收集和管理所有这些数据的基础设施。但首先,你能否告诉我们一些构成你正在讨论的遥测数据的示例?
希·查拉库迪:绝对的,也许你可以举一个例子,这样联系起来可能更好。所以,如果你考虑我们的网络设备,把它想象成你家里使用的调制解调器,希望它是我们提供的 Aruba 调制解调器。
但如果你考虑这个调制解调器,我们所做的是,这个调制解调器不断地为我们生成数据,我们通过我们的服务器监控这些数据,它会告诉我们行为。
所以,假设一个组织在整个办公空间部署了大约 70、80 或 800 个这样的调制解调器,我们可以利用这些数据真正了解这个生态系统的行为模式。
我最近的一个例子是,我们有一个组织部署了大约 800 个这样的调制解调器。我们发现大约 30% 的设备很少被使用,因为那些是人们从未去过并访问数据的偏远地区。
因此,我们所做的是,为这个组织制定了一项优化计划,以便重新利用或以正确的配置放置这些调制解调器,以最大限度地提高他们在我们身上的投资回报。
这是一个双赢的结果,因为我们不仅能够为客户提供更好的解决方案,而且客户也能够节省基础设施的整体优化效率。
这就是遥测带给我们的巨大优势。当你谈论 AI/ML 以及所有这些东西时,它可以帮助我们了解设备的自我修复模式,了解它如何控制其周围生态系统的温度。
这些数据可以完全用来了解我们的产品目录。我们如何根据客户角度来看设备的故障频率来改进我们的产品,例如,如果一个设备在某个客户那里出现了四次故障,但没有造成中断,但对我们来说意义重大。
这意味着我们要召回该产品,以便我们可以修复它,并防止此类故障再次发生。所以我可能会从两个方面来看待这个问题,首先,我们专注于利用遥测数据为外部客户提供服务和优化,但更重要的是,我们从这些设备中学到了我们产品的性能,我们无法真正改进这一点,以便为客户创造更好的产品。
迈克尔·克里格斯曼:这太有趣了。所以,你正在收集这些大量遥测数据,你将这些数据通过你的机器学习模型运行,然后为你提供行动项目,我们可以说,无论是将信息反馈给产品设计还是以某种不同的方式将这些产品部署给特定客户。但由于这些数据源,特别是遥测数据,最终都变成了可操作的。
希·查拉库迪:绝对的。我认为,在我的数据中获得深刻的见解和可操作的见解,就是让事情变得切实可行的关键,迈克尔。我认为这就是 - 不要误解我的意思,并不是所有数据都取得了成功。
我们确实采取了许多快速失败的方法,但让我们兴奋的是,我们可以处理这些行动,我们可以更重要的是让我们的客户受益。我认为这就是让我们重新专注于收集这些数据并更好地服务客户的关键。
迈克尔·克里格斯曼:你提到这些数据还会向上游反馈给产品设计、产品开发。你能详细介绍一下吗?
希·查拉库迪:绝对的。我认为,随着我们了解这些数据,我们在每个产品生命周期中都有研发团队。我们确实有研发团队,我们将这些数据交给这些业务负责人,然后他们调查数据,从中识别出可操作的见解,并将这些见解优先纳入投资生命周期,然后根据数据告诉他们的需求相应地使用这些见解。
这是一个不断循环的过程,理解数据,试图从中获得一些有意义的东西。我的数据科学家帮助他们理解数据,将特征集与数据连接起来,然后试图从中得出可操作的见解,然后将这些见解反馈到产品生命周期中,用于未来的产品功能。
迈克尔·克里格斯曼:听起来随着时间的推移,这些遥测数据对你来说正在成为越来越重要的信息来源,用来改进你销售的产品和服务。
希·查拉库迪:绝对的。绝对的,因为数据在与我们对话。我们越是试图解释和理解数据的语言,我们就会做得越好。
就像我说的,我不想说我们已经完全掌握了这种语言,我们还在不断学习和发展。但我认为这就是乐趣的开始。能够理解、解释并从数据中获得一些意义。
迈克尔·克里格斯曼:现在,让我们谈谈你几分钟前简要提到的基础设施。首先,你是在处理实时数据还是非实时数据?你主要处理哪种类型的数据?
希·查拉库迪:这真的是一个混合体,我认为,迈克尔,这更多的是由用例驱动的。从架构和基础设施的角度来看,我可以告诉你,我们相当复杂,可以处理实时数据和非实时数据。
我所说的用例驱动,让我举个例子。例如,客户向我们下了订单,然后他们想要立即了解订单在哪里?订单的生命周期在哪里进行?发货日期是什么样的?他们想立即对订单进行更改。
这些应该实时处理。因此,我们对它们进行实时数据处理,将其导入我们的基础设施,从源到目标跟踪数据。
当它从源头开始,我们可以把它想象成一条管道,我们能够即插即用,并在我们需要的时候以正确的方式获取数据,用于运营目的。
但正如我们谈到的遥测数据或客户数据,我们将这些数据收集到我们的数据湖中,然后对这些数据进行大量聚合,将多种数据汇集在一起,将社交数据、遥测数据和客户数据整合在一起,聚合数据并创建一个消耗层,这通常不是实时完成的。
因为你需要时间,你需要理解数据,你需要能够解释数据的含义,而这需要大量的计算能力和对数据进行大量的处理。
所以通常情况下,这会在后端作为一个非实时数据发生,我们可以进行 AI/ML,但在大多数情况下,我们的客户体验和客户需求都是通过实时数据完成的。
迈克尔·克里格斯曼:所以你的基础设施足够灵活,可以处理所有这些不同类型的数据源,并将它们整合在一起,以便你可以进行任何适当的分析吗?
Shy Chalakudi:迈克尔,我不会说我们拥有一个完全成熟的架构来支持所有业务案例。我不相信作为一个技术人员和数据架构师,你能够拥有一个能够支持所有业务案例的架构。
在我们为最终客户提供建议时,我要求我的团队采用的关键原则之一是确保我们优化基础设施。但我可以向你保证,我们确实拥有一个快速的数据架构,以及我们嵌入并遵循的明确定义的数据原则。
当一个业务用例来到我们这里时,我们会查看用例,了解它的数据需求,了解它的消费需求,并确保我们可以以即插即用方式将其嵌入到我们现有的架构中。
迈克尔·克里格斯曼:所以你从业务用例开始,然后根据该特定用例优化从开始到结束的路径?
Shy Chalakudi:当然。我认为每个业务用例,我们都有一个非常严格的原则,即了解它将带来的价值主张。
因为就像我说的,尽管我们谈论存储非常便宜,尤其是因为我在 HPE 工作,我们使用的大多数基础设施都是 HOH,我们称之为 HP on HPE。但尽管如此,我认为我们的原则就是确保我们优化。
我有一个很大的优势,或者你可以称之为责任,那就是成为我们产品的零客户。可以称之为自带香槟。
所以我经常与客户讨论我现有的数据架构,以及我如何优化它,以及我如何重复使用它的各个组件,以向他们展示一个真实的用例,供他们在其基础设施中实施。
因此,对我们来说,非常重要的一点是确保我们在 HPE 内部构建的任何东西都是我们能够自信地向最终用户推荐的东西。所以它是相当优化的,并且是根据用例驱动的,我们正在支持。
迈克尔·克里格斯曼:所以当涉及到数据时,你的客户零,意味着你是测试者。
Shy Chalakudi:我才是测试者,我不想说吃自己的狗粮,我更愿意说喝自己的香槟。现在,这就是我的看法。我是我产品团队的第一道防线。
我们使用的大多数基础设施,包括我们现有的数据结构中的基础设施,都在 greenlit 上,我们狂热地支持或鼓励客户使用的产品。
而我是我产品团队的第一个测试平台,一个实时测试平台。所以我会很好地融合,而且这是一个相当有趣的体验。当我们使用它时,我们能够与我们的客户产生共鸣,我们能够从客户的角度看到,而且我们能够在我们去见客户之前识别出真正的问题。所以,成为我们产品的第一个客户对我们来说是一个巨大的胜利。
迈克尔·克里格斯曼:你们处理了多少数据?你们需要这些数据的速度有多快?你能给我们一个了解数据本身语境的意义吗?
Shy Chalakudi:当然。我们谈论了很多遥测数据,当你谈论遥测数据并查看 ZB 级的数据时,我会非常小心。
所以我想我的方法就像我说的那样,是在一段时间内收集数据,离线分析它,然后识别趋势。如果你查看正在处理的那种 ZB 级数据的用例,你不会查看实时快速响应的性质。
它更多的是关于分析理解和基于数据告诉你的内容创建解决方案。但是,当你查看我们谈论的报价到现金时,这是 HPE 的核心业务,ERP 系统,在那里你可能谈论的是 PB 级数据。
所以你仍然在谈论大量数据,但不像遥测数据那样巨大、庞大。所以我觉得我们的方法更多的是关于包含式架构,在自己的基础设施内进行管理,根据我们的需求管理存储,并有效地利用数据来满足实时需求,这可能是我会考虑的。
迈克尔·克里格斯曼:你们使用什么样的基础设施来收集、管理和分析所有这些数据?这些数据太多了。
Shy Chalakudi:从基础设施的角度来看。我很幸运能为 HPE 工作,因为就像我说的,我是零客户。我的大部分基础设施都是 HOH、HPO 和 HPE,但当然我们也依赖于在我们内部广泛使用的第三方产品和第三方开源产品。
同样,我的目标是创建一个与最终客户匹配的基础设施指南或基础设施蓝图。所以这是我方法的前提,显然我会有一个嵌入式的第三方。
如果你考虑任何常见的数据湖,你可能会查看一个 Hadoop 基础设施,它可以处理多个映射,或映射/归约作业,Spark,运动流,Kafka 流,在我们的企业中,我们拥有那个基础设施 Delta Lake。
这对我们的客户和我自己来说非常重要,它帮助我们将传统的 RDBMS 与最新最好的灵活模式架构结合起来,这在我的基础设施中非常重要。
然后,如果你查看微服务和 Fast API,我们推动的一件大事是确保我们可以解耦所有这些知识块。
我们解耦得越多,我们就越受益,因为我们可以更有效地管理即插即用架构。因此,Fast API 和微服务架构是我的基础设施中非常重要的组成部分。
迈克尔·克里格斯曼:你们有多少基础设施是基于云的,有多少是在本地部署的?
Shy Chalakudi:对我来说,我想说,再次,我们拥有私有云的优势,所以从私有云的意义上来说,大部分都是基于云的。
但我们确实有一些遗留基础设施,所以我们并不陌生于拥有遗留基础设施和技术债务,就像我们大多数客户一样。
所以我们的大部分数据都在本地部署。所以我会使用我的 [INAUDIBLE] 产品,我们非常愿意将所有这些数据无缝地整合到一个数据结构中,这使我能够从本地部署无缝切换到云,这是我能够在我的基础设施中有效利用的最大优势之一。
迈克尔·克里格斯曼:你们如何决定将数据放在本地还是云端?
Shy Chalakudi:说实话,我认为自动化提出的问题更多的是关于数据量,因为默认情况下是基于云的,对于我们来说,就是私有云,这就是我们大多数默认开始的方式,也是我们的指导原则。
但就像你之前谈到的那样,它也取决于数据量。重要的是你的数据要与你的业务流程保持非常接近。在你需要实时数据的环境中,在你想要快速响应客户的环境中,在你想要有效地管理数据并对其进行响应的环境中,这种数据通常会留在本地部署。
因为在那里你可以快速采取行动,并做出你必须做出的决定。但像我们谈论的遥测数据或 Salesforce 这样的东西,通常会驻留在云端。
因为在这种情况下,你确实拥有时间和存储的优势。你首先查看存储,然后如果它是更多的时间,那么你就会有时间,你可以等待并通过它来处理私有云的情况。
迈克尔·克里格斯曼:所以你们根据具体的用例做出了明确的决策,这确实有意义?
Shy Chalakudi:当然。我认为这可以追溯到我之前所说的话。我们的大部分基础设施和我们的大部分决策都是基于架构驱动的。
当然,我们确实有一个架构框架,它适用于大多数用例,但迈克尔说的很对。我认为重要的是我们查看用例并针对它进行设计,因为它们中的每一个都是独一无二的,它们都有我们需要的独特需求。
迈克尔·克里格斯曼:Shy,你之前使用了“数据文化”一词,跟我们谈谈 HPE 的数据文化,以及你想要用数据文化做什么?
Shy Chalakudi:随着行业越来越多地朝着技术趋势发展,数据正在成为一种通用语言。我认为我们都必须成为数据通晓者,才能在当今任何行业中生存。
所以对我们来说,最重要的方面之一是在今天将这种文化嵌入 HPE 内部。对我来说,好消息是,我们之前讨论过的商业策略是围绕帮助企业有效管理数据建立的。
所以,将这种商业语言翻译成内部数据语言对我来说更容易,并将它嵌入到我们文化的这一部分。所以我们已经建立了数据运营模型,我们称之为数据运营模型 2.0,以支持安东尼奥的转型业务战略。这使我们能够在所有业务合作伙伴中灌输我们需要的 数据素养和数据重点
迈克尔·克里格斯曼:你们的团队构成如何?你们如何使这种数据素养在组织内部成为可能?
Shy Chalakudi:再次,这是一个好问题,我认为我可能建议大多数数据领导者去看看的是,当我查看团队时,当你谈到它时,迈克尔,我认为它是一个扩展的组织。
因为每个数据消费者都必须是数据通晓者,才能取得成功。所以我们所做的是,作为数据运营模型的一部分,我们强调的一项重大改变是,每个业务组织都有一位数据领导者。
而数据领导者是该组织中一位非常高级的领导者。如果你要引用我们首席运营官的话,我们会说数据领导者需要关注两个问题。
一个是,我需要哪些数据来运营我的业务?这是首要目标。他们会查看所有这些业务流程并说,我需要哪些数据来运营我的业务,我是否有正确的数据?
但最重要的是,我认为我们要求他们做的角色是,我缺少哪些数据,我没有的,但我需要这些数据来推动我的业务进一步发展?
所以我认为这种角色非常重要,它来自于自上而下的支持,这使我们能够将数据素养带到每个业务部门。
我们企业内部还有数据管家和数据管理人。管家通常在业务部门,他们的工作是作为数据的守护者。他们拥有他们所拥有数据,以确保围绕数据制定的政策和原则清晰地建立起来。
而数据管理人属于我的团队。他们的工作是作为管家的一部分,尽可能地围绕数据进行自动化。我认为技术数据管理人与拥有和管理数据的业务负责人(即管家)的结合,有助于我们管理数据整理,而数据整理是我们投入大量时间的工作。
从我团队的角度来看,我认为我们是一个非常小的团队,因为我认为整个费用是我的扩展组织。通常我的团队专注于数据分析师、数据工程师和机器学习工程师,他们专注于自动化和创建这些管道,以便最终用户能够从数据中获取价值。
迈克尔·克里格斯曼:沙伊,你描述了数据转型、数字化转型、组织转型,你多次提到这是由你们的首席执行官推动的。那么,你能描述一下数据对惠普组织的影响吗?
沙伊·查拉克迪:当然。如果你考虑我们作为服务的业务模式,我强调的是,我们不仅仅是想改变我们的计费模式,使其更加基于使用量的计费,而是为我们的业务合作伙伴提供定制化的解决方案。
因此,我们有一个重要的用例是了解我们客户的需求。我可能给你举个例子。当我们查看我们多个客户的遥测数据时,能够将数据与他们与我们现有的订阅联系起来,并能够为他们提供个性化的解决方案以满足他们未来的需求。
所以我们会坐下来与我们的客户交谈,我们不仅仅关注过去的历史数据,还关注他们未来的业务需求。他们从行业数据、我们拥有的社会数据中获取未来的趋势,并能够为他们创建模式。
因此,数据不仅帮助我们从客户的角度了解他们,还能获取社会和周边数据,为他们提供我们认为他们需要的预测。
在大多数情况下,迈克尔,我们发现客户可能甚至没有考虑过他们的需求,他们拥有的是什么。但是我们基于经验将这些信息与他们一起提出,这对我们的业务角度的底线产生了很大影响。
我能给你的另一个例子是,我们正在成为一个零客户。在我们经历所有这些变化时,我们试图在个性化和标准化之间取得平衡。
当然,行业中的任何人都知道,你越个性化,是的,你试图更接近你的客户,但你会给你的运营增加很多开销。在两者之间找到平衡很重要。
因此,这种成为零客户,能够从最终用户的角度理解,我们试图将尽可能多的客户需求整合到标准化中。
我认为最近我们提出的一项建议是将 Presto 集成到这个模型中,这已经成为了公开信息。
因此,在我们了解客户需求,成为零客户的同时,我们也能够向我们的产品提供见解,即他们应该采用什么最好的产品路线图,以便在为客户需求提供个性化服务的同时,更接近标准化。
迈克尔·克里格斯曼:沙伊,鉴于你所描述的一切,我不得不问你,对于那些希望效仿你所描述的将数据嵌入组织 DNA、组织结构的商业领袖,你有什么建议?
沙伊·查拉克迪:这是一个好问题。迈克尔,一个很棒的问题。在我的职业生涯中,我一直是一名数据负责人,已经有近 15 年了,我可以告诉你,围绕人工智能/机器学习的常见误解是什么。
我们大多数人认为人工智能/机器学习是一个新的流行词,大约在八到十年前,这个行业是关于大数据的。我们认为机器学习和人工智能将解决我们所有的问题。
相信我,我是一名人工智能/机器学习的博士生,我的论文对此非常重视,但我认为了解“垃圾进,垃圾出”很重要。
因此,你需要专注于你的基础,你需要确保你花时间——老实说,这不是工作中有趣的部分,这是一项艰苦的工作,但要确保你能够有效地管理你的数据。
我认为这就是我会要求你重新关注的地方。在基础上,确保它非常强大,你拥有良好的数据治理策略,你能够建立一个非常标准的数据运营模型,你拥有可重复的系统和流程。
接下来我可能会考虑一种平衡的方法,我称之为阴阳,或者在我的策略中,你会正式地将其视为防御和主动策略。
区别更多地在于,我所说的是确保你遵守治理策略,确保你关注安全性。你最不想看到的是头条新闻,而且我们一次又一次地看到关于数据的这种情况,网络威胁正在发生,有关你数据中发生安全漏洞的头条新闻。
并且,当你创建越来越多的东西时,你试图创建这种共同的数据结构,你必须考虑到你正在为公司创造皇冠上的明珠。
所以你最不想做的事情就是把钥匙交给你不希望拥有钥匙的人。因此,专注于防御、专注于安全性、专注于数据策略,成为你必须成为的强硬合作伙伴,这对任何数据负责人来说都非常重要,尤其是当他们担任企业角色时,拥有这种标准策略非常重要。
然后,从主动策略的角度来看,我通常的做法是遵循我所说的“n 等于 1”策略。也就是说,从小处着手,从一个用例开始,了解你的用例可以带来的业务价值,然后开始实施该用例,向你的客户展示业务价值。
我认为你越开始展示价值,你就可以更容易地争论你的解决方案,而不是构建一个巨大的海洋或解决整个端到端策略。
我始终发现,能够防御并引入主动策略是一种帮助我在我之前所有角色中取得成功的策略,并且在这里没有任何改变,我还会继续这样做。
我最后想说的是,不要试图独自完成它。这是一个海洋,不断发展,数据技术在过去 10 年中发生了最大的变化,并且还有更多变化即将到来。
寻求帮助,我寻找——如果我可以在此插一句,迈克尔,我想说,惠普是一家致力于帮助企业提供数据解决方案的公司。因此,寻找外部客户、外部产品方面的帮助,并实现一个成功的端到端策略。
迈克尔·克里格斯曼:非常实用的建议,重要的建议。沙伊,这一切将走向何方?数据的未来是什么?
沙伊·查拉克迪:我认为数据将无处不在。如果你考虑一下过去十年的情况,如果我没记错的话,我认为 2010 年全球创造了大约 2 泽字节的数据。
今天,如果你能想象迈克尔,在 10 年后的 2020 年,我们正在创造大约 41 泽字节的数据。我的意思是,看看增长量,而我们才刚刚开始我们的旅程。
我们越来越多地将机器引入我们的日常运营,我们拥有越来越多的蓝牙,越来越多地,我们正在走向边缘计算。这种数据量只会增加。
正如我之前所说,随着自动化成为我们的常态,它不再是一种奢侈品,机器人正在成为我们日常生活的一部分。数据运营和 DataOps 以及更多地关注自动化正在成为我们必须继续关注的一件大事。
5G 正在成为一个新的无线标准。企业将利用边缘分析,并开始进行实时定位。我的意思是,我们距离能够进行太空旅行并在短时间内返回已经不远了。
因此,我认为,如果你从数据的角度来看,它将成为公司必须关注的最大资产。我知道我们一直在行业中听到关于这一点的消息,但我真的相信数据将成为一项资产,并成为所有公司资产负债表的组成部分。
我认为,数字原生企业将领先于我们,向我们展示如何做到这一点,数据将成为一种通用语言。我知道我们谈论的是成为一个扁平化的宇宙,我认为数据将成为让我们能够用一种共同的语言相互交流以及与机器交流的工具。因此,我们每个人都必须具备数据素养。
迈克尔·克里格斯曼:数据作为资产负债表的一部分。我喜欢这个说法,我以前从未听说过。沙伊·查拉克迪,非常感谢你今天抽出时间与我们交谈。
沙伊·查拉克迪:谢谢你,迈克尔,感谢你邀请我。我也很享受这次谈话。数据是我的一大爱好,感谢你给我一个平台,让我与你们所有的观众分享我的观点,谢谢。
迈克尔·克里格斯曼:非常感谢 Redis 让这个播客成为可能。感谢 Redis。
电子书
数字经济正在挑战银行家重新评估他们的商业模式。了解在向实时金融服务转型时出现的四种常见挑战的解决方案。