dot Redis 8 发布了 — 它是开源的

了解更多

什么是 AI 代理?

如果你像我一样——听到“代理”(agent)这个词时,你想到的是做酷事的特工。嗯,在 AI 的世界里,代理当然可以是特工,但它们也可以是你 iPhone 上的 Siri 之类的东西。这些 AI 代理可以是任何以某种方式感知其环境,然后采取行动帮助实现你目标的实体。例如,你知道在《马力欧赛车》(Mario Kart)中,你的电脑对手并不都试图争夺第一吗?电脑控制的赛车手被分配了一个“预期”的比赛结束名次。每个代理感知它们在比赛中的位置、速度、加速能力等,然后采取加速、减速、使用道具等行动,以达到其在分配名次完成比赛的目标。这是一项复杂的任务,因为它涉及多种因素和决策过程。

在不断变化和演进的人工智能领域,“代理”是一个基石概念,代表着会做事的东西。听起来超级模糊,对吧?因为这是故意为之。代理可以简单且反射性,例如当你闯红灯时,红灯摄像头会拍下你的车牌。代理也可以持续监测一段时间内的互联网流量水平,并使用历史数据来确定何时需要发送警报,因为流量与“应有”的水平不符。所有代理都有一个共同点——它们能够感知其环境并采取某种行动。

代理有两个基本组成部分:用于感知环境的传感器,以及用于与环境交互的执行器。

所有代理都有某种机制来感知其环境。这可能包括简单的数据输入,比如十字路口的摄像头,也可能包括更复杂的输入,比如自然语言或其他需要处理的符号形式。这就是理性代理概念发挥作用的地方,因为它旨在根据其知识和推理能力,在特定情况下做出最佳决策。

既然代理式 AI 的最终目的是作用于其环境,它就必须能够做 一些事情。这些执行器可以是从能够拍照的相机,到能够对问题生成自然语言回复的对话式 AI 聊天机器人。

当我们转向像《马力欧赛车》中的赛车手这样的例子时,我们加入了推理和目标。每个非玩家角色(NPC)在赛道上都有一个他们试图达到的目标位置。他们的感知包括他们在队伍中的当前位置、速度、是否可以进一步加速、是否有可用的道具等。然后,赛车手必须推理出达到目标位置的最佳行动方案是什么。是使用道具然后加速?还是先加速并保留道具以备后用?这些赛车手背后很可能有一个模型,通过练习赛进行训练并拥有历史经验来做出决策;但由于所有这些模型都基于概率,赛车手可能在不同的比赛中做出不同的决策,无论玩家玩多少次,都能产生引人入胜的体验。

AI 代理的类型

那么有哪些类型的代理呢?这是一个简单的分类法:

简单反射代理

这些代理完全基于当前的感知做出决策,不考虑事件的历史。它们是反应式代理,缺乏为未来规划的能力。

基于模型的反射代理

这些代理维护着一个世界模型,因此能够在部分可观察的环境中行动。这些代理了解它们的行为如何影响其所处世界。

基于目标的代理

这些代理被赋予了一个特定目标,然后根据不同行动对实现这些目标的贡献程度进行评估。这些代理具有一定的选择能力。

基于效用的代理

这些代理为不同的结果分配价值和效用,并选择能最大化预期效用的行动。这引入了对偏好和权衡的考量。

学习代理

这些代理通常通过机器学习整合反馈,根据经验随着时间推移调整和改进其行为。这是生成式 AI 的一个关键方面,系统根据其训练数据学习生成新的内容。

一旦你理解了每种代理,就可以开始将它们组合成多代理系统。多代理系统可以是异构的,意味着代理具有不同的能力和目标;也可以是同构的,意味着所有代理具有相同的能力和目标。这些系统可以是协作的或竞争的,代理们要么共同努力实现一个共同目标,要么相互对抗以各自实现自己的目标。我们还可以创建分层代理,其中高级代理为执行更简单任务的低级代理设定目标和参数。这使得高级代理和低级代理都能更高效和专业化。

AI 代理的应用

虚拟助手

Siri、Google Assistant 和 Alexa 等 AI 代理是虚拟助手的例子。它们都感知用户的音频输入,处理音频,并决定对任何特定查询的最佳回应。

机器人技术

机器人技术领域的 AI 代理可以涵盖从控制装配线上的机器人到控制自动驾驶汽车。这些代理感知从交通到尺寸的各种事物,并采取诸如将零件拧在一起和变道等行动。

网络安全

用于网络安全的 AI 代理可以检测恶意软件、网络入侵和 DDoS 攻击等。这些代理感知异常的网络流量,并采取诸如向人员发出异常警报等行动。

游戏

游戏中的 AI 代理通过增加非玩家角色的深度,使游戏世界感觉更加生动。这些代理从《马力欧赛车》中的赛车手到《求生之路》(Left 4 Dead)中的“总监”(The Director)各不相同,它们感知从比赛中的位置到玩家赢得战斗的容易程度等事物,并采取从加速到调整敌人强度等行动。

还有许多其他已经投入使用的 AI 代理示例。其他一些广泛的例子包括:提供个性化治疗方案的医疗保健代理,根据你是否在家调整温度的智能家居监控代理,以及跟踪天气模式和作物产量等并向科学家发出变化警报的环境监测代理。

演变中的挑战与未来前景

尽管 AI 代理取得了显著进展,但挑战依然存在。与道德决策、算法偏见以及 AI 代理决策可解释性相关的问题是活跃的研究领域。随着 AI 用途的不断演变以及人们对挑战和机遇的日益熟悉,解决潜在陷阱变得越来越重要。例如,虽然 OpenAI 的 ChatGPT 明确声明“ChatGPT 可能会出错。请考虑检查重要信息。”,但并非所有人都阅读了细则或认真对待,有些人甚至将其提供的信息当作事实传播,而这些信息可能并非事实。

这些代理极大地改善了全球人民的生活质量,并将继续如此。从自动驾驶汽车让你能够小睡等奢华体验,到改变世界粮食生产的作物改良,AI 代理无疑是一股向善的力量。

现在可以用来开发的 AI 代理(无需自己构建)

OpenAI 的 GPT-3:用于自然语言处理任务,包括聊天机器人和内容创建。

Google 的 TensorFlow:用于机器学习和神经网络开发的综合库。

Facebook 的 PyTorch:以其在 AI 研究和开发中的灵活性和易用性而闻名。

Microsoft 的 Azure AI:提供一套 AI 服务,包括机器学习、知识挖掘和 AI 应用。

IBM Watson:以其强大的自然语言处理(NLP)能力而闻名,适用于构建复杂的 AI 解决方案。

Google 的 Dialogflow:一个用户友好的平台,用于创建对话式用户界面。