Auto-GPT的思考

人工智能 2023-04-24 563 次浏览 0 条评论 次点赞

当OpenAI/ChatGPT概念风行之时,激发了一些人的AI奇想,比如:

  • 用ChatGPT生成Prompt,让Midjourney去绘画。Midjourney十分依赖Prompt技巧,可能需要十几个乃至几十个提示词,才能输出用户想要的图案。
  • 波士顿动力机器人+OpenAI,训练战斗机器人。波士顿动力公司(Boston Dynamics)替美国军方开发的四足机器人:波士顿机械狗(Boston Dynamics BigDog),BigDog 是第一个离开实验室的有腿机器人。

maxresdefault.jpg

要实现这些AI奇想,需要通用人工智能(Artificial General Intelligence,AGI,强人工智能)和 AI 代理(AI agent或者Intelligent agent),它感知环境,自主采取行动以实现目标,并可以通过学习或获取知识来提高其性能。Auto-GPT就是一个AI 代理。

20230424102705.png

Auto-GPT 是目前最火爆的AI项目,位居 GitHub 趋势榜首。自 3 月30 日 发布,两周时间狂揽 50K + 星,是第二个获得100k Stars的开源AI项目(仅用了三周时间)。

star history of Auto-GPT

Auto-GPT 是一项使 GPT-4 完全自主的实验性开源尝试,充分展示了 GPT-4 语言模型的功能,将 OpenAI 的 GPT 模型的多个实例链接在一起,以自主实现用户设定的任何目标。比如,它可以在互联网上找到无人认领的钱,增加您的社交媒体帐户,甚至发展电子商务业务。

  • 通过写入和读取数据库和文件来管理短期和长期记忆;
  • 通过汇总管理上下文窗口长度要求;
  • 可以在无人值守的情况下执行基于互联网的操作,例如网络搜索、网络表单和 API 交互;
  • 并包括用于语音输出的文本到语音。

Auto-GPT使用GPT-4来生成、优先处理和执行任务,使用插件进行互联网浏览和其他访问。它使用外部存储器来跟踪它正在做的事情并提供背景,这让它能够评估其情况,生成新的任务或自我纠正,并将新的任务添加到队列中,然后对其进行优先排序。

Auto-GPT可以递归地调试、开发和自我改进。也就是说,您只需要输入一句话,然后Auto-GPT自己制定计划,全网搜索、分析资料、优化策略,甚至会衍生出自己的子智能体来帮助自己完成计划,最后返回您想要的结果,可以帮助您自动化和优化业务流程、生成测试用例、调试代码,甚至生成新的业务创意。

eyatzqgn1vgaeu5xqolk.webp

在开发者最初提供的案例中,用它来浏览网页,并为下个即将到来的节日,创作出独特且原创的食谱。Auto-GPT能够拆解 3 大步骤:

  • 提出 “想法”,如 “我将搜索即将到来的合适节日,并创作出一个相关且有趣的食谱。”
  • 开始 “推论”,得出 “若能找到即将来临的节日,便有助于想出一个相关且有趣的食谱” 的结果。
  • 生成 “评论”,表达对于整个过程的事件的担忧和限制。

Auto-GPT的基本特征


🌐 上网进行搜索和信息收集
🔗 访问流行网站和平台
💾 长期和短期的记忆管理
🧠 用于文本生成的 GPT-4 实例
🗃️ 用GPT-3.5进行文件存储和汇总

Auto-GPT 最令人印象深刻的是它能够自主反映和改进其行为,这是通过使用计划、批评、行动、阅读反馈和再次计划的反馈循环来实现的。基于目前GPT的最强项,它有可能使任何人都可以进行编程。


开始使用 Auto-GPT


  1. 在计算机上安装 Git 和 Python(3.7 or later)。
  2. 下载并安装该应用程序,期间会安装 Auto-GPT 的依赖项。
  3. 设置来自 Pinecone 和 OpenAI的两个 API 密钥。

    • Pinecone 可以轻松构建高性能矢量搜索应用程序。
    • OpenAI 是GPT-4的大本营。

    以及可选的三个 API 密钥。

    • ElevenLabs,自然语音合成和文本转语音软件,如果你想让人工智能说话。
    • Google API,如果您在运行谷歌搜索时遇到错误 429 问题。
    • HuggingFace API,如果要使用Stable Diffusion生成图像(默认使用 DALL-e)。
  4. 当程序运行时,系统会提示您输入您的 AI 的名称。接下来,您将被要求为您的 AI 定义五个目标。
  5. 与 Auto-GPT 交互:通过键入“y”授权每个步骤或通过键入“n”中断程序,还可以通过键入一条消息向 Auto-GPT 提供反馈,它将用于改进其建议。
  6. 如果您无权访问 GPT4,请使用GPT3.5 ONLY 模式。该实验正在研究实施GPT4All,最终,人们无需阅读 LLM 的源代码即可从中受益。

FtkmzboXoAIg5vi.jpg

更多设置和使用参考:Autogpt installation and featuresGetting Started with Auto-GPT for Beginners: Setup & Usage


Auto-GPT的前景


Auto-GPT 是 GPT-4 自主运行的首批示例之一,它突破了 AI 可能性的界限。最重要的,Auto-GPT是免费和开源的,您还可以联系发布商游戏开发公司Significant Gravitas(@SigGravitas)获得帮助。

该模型的创建者 Toran Bruce Richards 认为,它有可能使人类免于因闭源 AI 自动化而导致的大规模失业。

Andrej Karpathy评论Auto-GPT 是 prompt 工程的下一个前沿(Karpathy还说过,最热门的新编程语言是英语;微软主导的GitHub Copilot编写了自己 80% 的代码)。

因此,实际上Auto-GPT主要是一种自动分解、执行和优化的Prompt 工程,通过LLM自主产生Prompt。而如果您直接使用 GPT-4,则需要依赖人工来回输入提示词。一些人担心AI会取代整个公司并接管以前由人类完成的工作,Auto-GPT是一项可能的技术。

Karpathy分享了对该模型的精彩见解。他说,与人类不同,GPTs完全没有意识到自己的优势和局限性,包括他们有限的背景窗口和有限的心理数学能力。这可能导致偶尔出现不可预测的结果。然而,通过将GPT调用串联成循环,可以创造出能够感知、思考并朝着英语提示中定义的目标行动的代理。


AgentGPT


AgentGPT

同样的探索来自于亚马逊工程师Asim Shrestha的AgentGPT,致力于在浏览器中组装、配置和部署自主 AI 智能体的项目,用户只需要定义 AI 名称和目标,Agentgpt就开始自动思考(运行更多任务需要提供OpenAI API key)。使用AgentGPT无须Auto-GPT部署和Python编程。

👍

本文由 cds 整理发布,参考 CC-BY-SA 3.0 协议共享,欢迎转载、引用或改编。
感谢您的支持,以共同推动STEM公益教育!

楼主残忍的关闭了评论