人工智能代理是人工智能的未来——随着人工智能技术的不断进步,它们正变得越来越流行。
但什么是人工智能代理?它们能用来做什么?——AI 代理是一种可以在环境中自主行动的实体。
什么是人工智能代理?
人工智能代理是一种代表用户执行任务的软件。它们可以实现流程自动化,做出决策,并与周围环境进行智能交互。
"Botpress 的软件工程师主管 Patrick Hamelin 说:"人工智能代理就像魔法一样。"它们是超越典型chatbots 的神奇实体。"
人工智能代理是旨在感知环境并采取行动以实现特定目标的实体。这些代理可以是基于软件的实体,也可以是物理实体。
它们通过传感器感知环境,利用算法或模型处理信息,然后利用执行器或其他手段采取行动。
人工智能代理对劳动力意味着什么?
虽然很容易想象一个充满自主软件的世界能完成一栋办公楼的任务,但在不久的将来,人工智能代理将协助人类员工,而不是取代他们。
人工智能代理需要人类触发器来完成工作流程。虽然人工智能在各行各业的应用将继续增长,但人工智能代理和chatbots 并不是用来取代人类员工的。
我们很可能会看到,员工在工作流程中使用人工智能的教育和培训会越来越多,尤其是在那些可以轻松实现任务自动化的行业。如果操作得当,这种技能提升将使员工能够增加用于复杂或更具战略性任务的时间。这将提高员工的生产率和工作满意度。
但批评者是对的--在劳动力队伍中引入更多自主代理时,必须有意识地关心与他们并肩工作的人类。
人工智能代理和人工智能聊天机器人有什么区别?
Botpress 的一位软件工程师领导在靛蓝色背景上写下的一段话:"人工智能代理就像魔法。它们是超越典型chatbots 的神奇实体"。人工智能代理和chatbots 的目的和能力各不相同。Chatbots 是为了与人类互动而设计的,而代理则是为了完成自主任务而设计的。
最大的区别在于它们能够采取自主行动。由于人工智能chatbots 是为与人类对话而设计的,因此它们通常不会被编程为采取自主行动--它们的目的是直接协助人类。
另一方面,人工智能代理可能完全不与用户互动。在某些情况下,它们会接收开发人员下达的任务,并独立完成任务,而不与其他人类互动。
Chatbots 通常基于文本或语音,而人工智能代理可以是机器人吸尘器或智能恒温器。
不过,它们也有许多相似之处。除其他重叠之处外,它们都使用
- 通过自然语言处理理解文本
- 为其输出提供动力的大型语言模型(如OpenAI 的GPT 或 Google 的 Gemini)
- 矢量数据库可更好地理解人机交互中的文本输入
人工智能代理的特点
自主性
人工智能代理可以在没有人类干预的情况下运行,独立做出决定并采取行动。人工智能代理的自主性使其能够处理复杂的任务,并就如何以最佳方式完成流程做出实时决策,而无需人类对特定任务的具体步骤进行编码。
虽然自主代理的概念可能会让人联想到《2001:太空漫游 》中会说话的计算机 HAL 9000,但 人工智能代理仍然依赖于人类的指令。用户或开发人员需要花时间告诉代理做什么,但代理会自己解决问题,以最佳方式完成任务。
持续学习
反馈对于人工智能代理的长期改进至关重要。这种反馈有两个来源:批评者或环境本身。
批评者可以是人类操作员,也可以是评估代理性能的另一个人工智能系统。人工智能代理的环境可以代理的行动结果为形式提供反馈。
通过这种反馈循环,代理可以进行调整,吸取经验教训,并在未来做出更好的决策。随着经历更多任务,它将学会创造更好的结果。由于具有学习和改进的能力,人工智能代理可以适应快速变化的环境。
被动和主动
人工智能代理在环境中既是被动的,也是主动的。由于它们接受感官输入,因此能够根据环境变化改变行动方案。
例如,当一场突如其来的雷雨开始时,智能恒温器可以感知室内温度变低。因此,它会降低空调的强度。
但它也是主动的--如果太阳在每天大致相同的时间照进房间,它就会主动增加空调,以配合太阳温暖的出现。
人工智能代理的组成部分
人工智能代理乍一看似乎很复杂。因为它们确实很复杂。但是,更好地了解人工智能代理的关键组成部分可以帮助你掌握其内部运作。
这些要素对于创造能够自主执行任务的人工智能工具至关重要。
什么是代理功能?
代理功能是人工智能代理的核心。它定义了代理如何将收集到的数据映射到行动中。
换句话说,代理功能可以让人工智能根据收集到的信息决定应该采取什么行动。这就是代理的 "智能 "所在,因为它涉及推理和选择行动,以实现其目标。
什么是感知?
感知是人工智能代理从环境中接收到的感官输入。这些感知提供了有关人工智能代理所处可观测环境当前状态的信息。例如,如果人工智能代理是一个客户服务聊天机器人,那么感知可以包括
- 信息
- 用户配置文件信息
- 用户位置
- Chat 历史
- 语言偏好
- 时间和日期
- 用户偏好
- 用户情绪识别
蓝白相间的图形列出了客户服务的概念chatbots。代理会输入信息,帮助他们做出最佳决策。客服聊天机器人会考虑客户的情绪、位置和聊天记录。
什么是执行器?
执行器是让人工智能代理与其环境进行物理交互的机制。这些动作包括驾驶自动驾驶汽车、在屏幕上输入文字等。
执行器可以被看作是人工智能代理的肌肉,执行代理功能做出的决定。
执行器的例子包括
- 文本回复生成器负责生成文本回复并发送给用户。它们将聊天机器人的文本回复通过聊天界面发送给用户。
- 聊天机器人可能需要集成一个系统(如公司的 CRM 系统)来访问客户数据、创建支持票据或检查订单状态。服务集成 API允许聊天机器人与外部系统交互,并根据需要检索或更新信息。
- 执行器可以发送通知和警报,如电子邮件通知或短信。它们可以通过发送推送通知,提醒用户即将到来的约会、订单状态变化、促销活动或其他相关更新,从而让用户保持参与并了解信息。
通知和警报是人工智能代理与其环境互动的一种方式。
什么是知识库?
知识库是人工智能代理存储有关环境的初始知识的地方。这些知识通常是预先定义或在训练过程中学习的。它是代理决策过程的基础。
例如,自动驾驶汽车可能拥有一个知识库,其中包含有关道路规则和县级法规的信息。同时,负责客户服务的自动代理可以访问公司产品和退货政策的数据库。
任何使用人工智能代理的企业都需要根据公司数据对其进行训练。虽然大型语言模型可以利用更广泛的互联网,但具有特定功能的代理需要根据用户的旅程创建特定的输出。
人工智能代理的应用
人工智能代理的应用领域非常广泛--它们已开始在全球众多行业掀起波澜。以下是一些最常见的应用:
客户服务
客服chatbots 是最常见的人工智能代理部署类型之一。
由于可以接入公司数据,企业可以使用人工智能代理充当客户助理。他们可以在世界任何地方直接访问用户的设备,包括通过他们的电脑或不同的应用程序(如 WhatsApp或FacebookMessenger )。
这些chatbots 和虚拟代理可以为客户提供特定的政策,让他们了解哪些项目可以满足他们的需求,甚至通过重置密码来访问他们的账户。
越来越多的公司希望提供客户服务chatbots --大多数都由大型语言模型驱动,可以完成特定任务。最好的客服还能代表企业采取行动,如预订餐桌或更新客户记录。
自动驾驶汽车
自动驾驶汽车和无人机是人工智能代理的最重要用途之一。借助人工智能代理的强大功能,这些车辆只需有限的人工投入即可运行。
人工智能代理是其功能不可或缺的一部分--它们能感知汽车所处的环境,并做出明智的决定(如何时转弯安全或何时减速)。它们可以识别汽车何时接近停车标志,或通过考虑环境输入探索新型地形。
Tesla 自动驾驶仪是一种高级驾驶辅助系统(ADAS),是一种部分(目前)自动驾驶汽车。
虚拟助理
Siri、Alexa 和 Google Assistant 等代理利用人工智能理解自然语言、协助完成任务、提供信息和控制智能设备。
人工智能助手的概念我们已经耳熟能详。人工智能代理可以实现下一步的深度个性化规划--如果你正在计划度假,它不仅可以为你推荐新的目的地和确定酒店,还可以充当你的私人旅行代理。由于人工智能代理可以自主完成任务,因此旅行机器人只需片刻时间就能代表您预订机票和酒店。
智能家居设备是人工智能代理的一个常见例子。
其他应用
- 人工智能代理可以控制和优化智能家居设备,比如通过供暖系统改变温度或设置防盗警报。
- 人工智能代理可用于机器人 领域,因为它们可以执行自主任务,如建造。一旦接到任务,它们就能根据自己对最佳实践的评估来完成任务。
- 与在智能家居设备中的应用类似, 人工智能代理也可用于网络安全领域。它们能够完成威胁检测、异常识别和安全管理等操作,抵御网络攻击并确保系统完整性。
- 在 供应链流程中 , 人工智能代理可用于优化路线、管理库存、预测需求,并提高物流运营的整体效率--它们可以找出操作它们的人类以前可能从未见过的解决方案。
人工智能代理的类型
有几种不同类型的人工智能代理--最佳选择取决于手头的任务。
简单反射剂
这些代理根据一套预定义的条件-行动规则进行操作。它们只对当前的感知做出反应,而不考虑先前感知的历史。
它们适用于复杂程度有限、能力范围较窄的任务。智能恒温器就是一个简单反射代理的例子。
智能温度计就是简单反射剂的一个例子。
基于模型的反射代理
基于模型的代理采用更先进的方法。它们维护一个内部环境模型,并根据对模型的理解做出决策。这使它们能够处理更复杂的任务。
它们被用于开发自动驾驶汽车技术,因为它们可以收集车速、前车距离和即将到达的停车标志等数据。代理可以根据汽车的速度和制动能力,做出何时刹车的明智决定。
基于效用的代理
基于效用的代理通过考虑每种可能行动的预期效用来做出决策。在需要权衡不同选项并选择预期效用最高的选项时,通常会使用它们。如果你想让代理向你推荐一些东西,比如行动方案或某项任务所需的不同类型的计算机,基于效用的代理就能帮上忙。
学习代理
这些代理被设计为在未知环境中运行。它们从自己的经验中学习,并随着时间的推移调整自己的行动。深度学习和神经网络经常被用于开发学习型代理。
它们通常用于电子商务和流媒体平台技术中,为个性化推荐系统提供动力,因为它们会随着时间的推移了解用户的喜好。
信念--愿望--意向代理
这些代理通过保持对环境、欲望和意图的信念,模拟类似人类的行为。它们可以推理并规划相应的行动,因此适用于复杂的系统。
基于逻辑的代理
基于逻辑的代理使用演绎推理做出决策,通常是通过逻辑规则。它们非常适合需要复杂逻辑推理的任务。
基于目标的代理
这些代理为实现自己的目标而行动,并能相应地调整自己的行动。他们根据当前行动的未来后果,以更灵活的方式做出决策。
基于目标的代理的一个常见应用是机器人技术--比如代理在仓库中导航。它可以分析潜在的路径,并选择最有效的路线到达目标目的地。
仓库可以使用人工智能代理执行各种任务,如运输和建造。
人工智能代理的未来
人工智能时代才刚刚开始。从第一台计算机到互联网,到第一个大型语言模型,再到新的代理技术,科技的发展日新月异。
人工智能的发展将创造一个全新的商业世界。在与大型企业互动时,与人工智能助手联系已经成为一种常态--随着技术的进步,人工智能助手独立完成各种任务的能力越来越强,它们的应用范围将扩大到各个行业。
开源人工智能代理框架
目前包括AutoGPT、AutoGen、Langfuse、ChatDev、BabyAGI、CAMEL、SuperAGI、MetaGPT、ShortGPT、CrewAI等。
AI 代理短期课程
正如吴恩达(Andrew Ng)2024年春天指出的那样,“人工智能代理工作流程将在今年推动人工智能的巨大进步——甚至可能比下一代基础模型的进步还要大。”
I think AI agentic workflows will drive massive AI progress this year — perhaps even more than the next generation of foundation models. This is an important trend, and I urge everyone who works in AI to pay attention to it. —— via DeepLearning.AI The Batch issue 241
为了顺应这一关键趋势,Coursera推出了一系列短期课程,帮助通过实践课程构建和实施 AI 代理,同时获得使用 crewAI、LangGraph、LlamaIndex 和 AutoGen 等领先框架的经验。
- 基于 crewAI 的多 AI 代理系统,由 crewAI 创始人兼首席执行官 João Moura 授课;
- LangGraph 中的 AI 代理,由 LangChain 联合创始人 Harrison Chase 授课;
- 使用 LlamaIndex 构建 Agentic RAG,由其联合创始人兼首席执行官 Jerry Liu 授课;
- 使用 AutoGen 的 AI 代理设计模式,由 AutoGen 的创建者、微软研究院首席研究员 Chi Wang 和宾夕法尼亚州立大学助理教授 Qingyun Wu 授课。
Botpress 是一款基于浏览器的人工智能聊天机器人构建工具,本文编译自其官网What is an AI Agent?自动化工具Zapier的官网提供了另外一个版本的解释What are AI agents? A comprehensive guide,可同步参考。
VIA https://botpress.com/blog……
楼主残忍的关闭了评论