AI 时代,你需要知道的 AI Agents 都在这里了

文章对当前流行的 AI Agents 开源项目进行了全面的梳理和汇总,并按照类别(通用、编程、数据分析等)组织。文章详细罗列了 Adala、Agent4Rec、AgentForge 等数十个开源 Agent 项目,并逐一介绍了它们的功能特点、应用领域和相关链接。这些 Agent 项目涵盖了通用、编程、数据分析、科学研究、化学等多个领域,为开发者提供了丰富的选择。通过阅读本文,开发者可以快速了解当前 AI Agent 领域的发展现状,并找到适合自己需求的开源项目。




前言

     大模型发展到现在,对IT产业的影响逐渐显现。未来的发展趋势一定是AI应用。目前主流AI应用分两类方向,一类是 copilot,一类是 Agent。        

     AI代理(也称为人工智能代理)是一种智能实体,能够感知环境、做出决策并执行动作。类似于人类,AI代理具有记忆、逻辑分析、任务拆解和综合解决问题的能力。它们的工作原理基于大型语言模型,通常由记忆、规划、工具使用和行动等模块组成。这些代理通过感知和决策来执行任务,可以自主学习和执行任务。继之前的AI代理能做什么?超越想象的智能,你准备好了吗?之后,本文重新对市面上的AI Agents进行了整理。

     关于copilot,由于篇幅限制,本文不作过多说明,AI Copilot通常是指一个通过AI技术赋能的智能助手,它协助人类完成各种任务。AI Copilot 可能在特定领域(如编程、写作、驾驶等)提供帮助,通过与人类的交互来提高效率和创造力。AI Copilot 可能更多地依赖于人类的输入和指导,而不是完全自主地完成任务。


开源的Agent项目一览

Adala[16]

Adala:自主数据(标注)代理框架

类别

通用,自建,多代理

描述

可靠的代理:基于真实数据构建,以获得一致、可信的结果。可控的输出:通过灵活的约束来定制输出,以满足您的需求。专注于数据处理:代理在自定义数据标记和处理任务方面表现出色。自主学习:代理通过观察和反思进化,而不仅仅是自动化。灵活且可扩展的运行时:适应性框架与社区驱动的演变,满足多样化需求。易于定制:快速为独特挑战开发代理,无需陡峭的学习曲线。

链接

文档[17]Discord[18]GitHub[19]

Agent4Rec[20]

带有1,000个代理的推荐系统模拟器

类别

通用,自建,多代理

描述

Agent4Rec 是一个推荐系统模拟器,它利用了1000个由大型语言模型(LLM)赋能的生成式代理。这些代理基于 MovieLens-1M[21] 数据集进行初始化,体现了不同的社会特质和偏好。每个代理以页面为单位与个性化电影推荐进行互动,并采取各种行动,如观看、评分、评价、退出和访谈。

链接

论文[22]

AgentForge[23]

面向LLM的通用平台,用于构建和测试代理

类别

通用型,自行构建,多代理

描述

一个为快速创建、测试和迭代AI驱动的自治代理和认知架构而设计的低代码框架,兼容各种LLM模型。便于轻松构建自定义代理和认知架构。支持多种LLM模型,包括OpenAI、Anthropic的Claude和本地的Oobabooga,允许根据特定需求为不同的代理运行不同的模型,提供灵活性。提供可定制的代理内存管理和即时提示编辑功能,以实现快速开发和测试。采用与数据库无关的设计,确保无缝扩展性,与ChromaDB等不同数据库的直接集成简便,适用于各种AI项目。

链接

GitHub[24]网站[25]Discord[26]X[27]

AgentGPT[28]

基于浏览器的无代码版本AutoGPT

图片
图片

类别

通用

描述

一个无代码平台流程:为代理分配目标观察其思考过程制定执行计划根据计划采取行动使用OpenAI功能支持gpt-3.5-16k、pinecone和pg_vector数据库技术栈前端:NextJS + Typescript后端:FastAPI + Python数据库:通过docker使用MySQL,同时支持本地运行SQLite

链接

文档[29]网站[30]GitHub[31]

AgentPilot[32]

在桌面应用中构建、管理和与代理进行交流

图片
图片

类别

通用

描述

集成到Open Interpreter和MemGPT中群聊功能

链接

GitHub[33]X[34]

用于构建语言代理的库/框架

图片
图片

类别

通用,自建,多代理

描述

长短期记忆:图书馆中的语言代理装备了通过VectorDB + 语义搜索实现的长期记忆和由LLM维持和更新的短期记忆(工作记忆)。工具使用:图书馆中的语言代理可以通过函数调用[36]使用任何外部工具,开发者可以在这里[37]添加自定义工具/API。网页导航:图书馆中的语言代理可以使用搜索引擎导航网络并获取有用信息。多代理通讯:除了单个语言代理,图书馆支持构建多代理系统,在该系统中,语言代理可以与其他语言代理和环境进行通信。与大多数现有的多代理系统框架使用预定义规则来控制代理行动顺序不同,代理包含一个控制器函数,该函数通过考虑先前的行动、环境和当前状态的目标,使用LLM动态决定哪个代理将执行下一个行动。这使得多代理通信更加灵活。人机交互:除了让语言代理在环境中相互通信外,我们的框架无缝支持人类用户扮演代理的角色,输入他/她自己的行动,并与环境中的其他语言代理互动。符号控制:与仅使用简单任务描述来控制整个任务完成过程的现有语言代理框架不同,代理允许用户使用SOP(标准操作流程)定义整体任务的子目标/子任务,为语言代理定制细粒度的工作流程。

链接

作者:AIWaves Inc.[38]论文[39]GitHub 仓库[40]文档[41]推文[42]




AgentVerse[43]

用于任务解决和模拟代理的平台

类别

通用、自建、多代理

描述

聚集多个代理以协作完成任务。允许自定义环境以观察或与多个代理互动。

链接

论文:AgentVerse:促进多代理合作并探索出现行为[44]Twitter[45]Discord[46]Hugging Face[47]

AI Legion[48]

多代理TS平台,类似于AutoGPT

图片
图片

类别

多代理,自定义构建

描述

一个由LLM驱动的自主代理平台一个可以协同完成任务的自主代理框架通过控制台直接消息与代理进行交互

链接

作者:eumemic[49]网站[50]GitHub[51]Twitter[52]

Aider[53]

使用命令行在你的本地仓库中编辑代码

类别

编码,GitHub

描述

Aider是一款命令行工具,让您能够与GPT-3.5/GPT-4配对编程,以编辑存储在本地git仓库中的代码您可以启动一个新项目或者处理一个现有的仓库。您可以在aider聊天中流畅地来回切换,询问GPT编辑代码,以及使用您自己的编辑器进行更改Aider确保您和GPT的编辑被提交到git中,并附有合理的提交消息。Aider的独特之处在于,它能够很好地与预先存在的、较大的代码库协作网站[54]作者: Paul Gauthier[55] (Github)Discord 邀请[56]

AIlice[57]

创建代理调用树以执行您的任务

图片
图片

类别

通用,个人助理,生产力

描述

以聊天机器人形式存在的代理可以独立规划自然语言给出的任务,并动态创建代理调用树来执行任务。代理之间存在交互机制以确保容错性。可以自动构建外部互动模块以自我扩展。

链接

GitHub[58]

AutoGen[59]

具有代理多样性的多代理框架

图片
图片

类别

通用目的,自行构建,多代理

描述

用于开发具有多个会话代理的LLM(大型语言模型)应用的框架。这些代理可以协作解决任务,并且可以与人类无缝交互。它简化了复杂的LLM工作流程,增强了自动化和优化。它提供了跨各种领域和复杂性的工作系统范围。它通过易于性能调优和实用功能(如API统一和缓存)改善LLM推理。它支持高级使用模式,包括错误处理、多配置推理和上下文编程。

链接

论文:AutoGen:通过多代理会话框架启用下一代LLM应用[60]Discord[61]描述系统的Twitter线索[62]

AutoGPT[63]

尝试使GPT4完全自主的实验

类别

通用目的

描述

一个试验性的开源尝试,旨在使GPT-4完全自主,GitHub上拥有超过140k的星标将LLM(大型语言模型)的“思维”串联起来,自主实现你设定的任何目标可以访问互联网以搜索和收集信息长期与短期记忆管理能够执行许多命令,例如谷歌搜索、浏览网站、写入文件、执行Python文件等等用于文本生成的GPT-4实例访问流行的网站和平台使用GPT-3.5进行文件存储和摘要通过插件进行扩展“很像是BabyAGI与LangChain工具的结合”在0.4.0版本中添加的特性文件读取命令自定义增强的测试功能

链接

Twitter[64]GitHub[65]Facebook[66]Linkedin[67]Discord[68]作者: Significant Gravitas[69]




Automata[70]

根据您的项目背景生成代码

类别

编程

描述

型号:GPT 4Automata 将您的项目作为上下文,接收任务并无缝执行指令。特点Automata 旨在发展成为一个完全自主、自编程的人工智能系统。它设计用于与所有可用的代理平台和LLM提供商无缝集成。利用新颖的代码搜索算法 SymbolRank 及其关联工具来构建卓越的编码智能。模块化,完全可配置设计,对外部依赖性最小化。

链接

GitHub[71]文档[72]作者: Owen Colegrove[73]

链接

推文[74]GitHub[75]Replit[76]作者: @yoheinakajima[77] (Twitter)




BabyDeerAGI[78]

是BabyAGI的改编版本,仅约350行代码

类别

通用目的

类别

通用目的

描述

特点并行任务(使其更快)仅限3.5增压(不需要GPT-4)用户输入工具网络搜索工具中的查询重写保存结果

链接

推文[79]GitHub[80]Replit[81]作者:@yoheinakajima[82](Twitter)

BabyElfAGI[83]

BabyDeerAGI模块,包含约895行代码

类别

通用

描述

特性技能类允许创建新技能带有向量搜索的“动态任务列表”示例Beta反射代理能够读取、编写及审查自己的代码

链接

推文[84]GitHub[85]Replit[86]作者: @yoheinakajima[87] (Twitter)

BabyCommandAGI[88]




测试当你结合CLI和LLM会发生什么

图片
图片

类别

通用,编程

描述

旨在测试将CLI和LLM(比GUI更传统的界面)结合时会发生什么的gent(由@saten-private创建)基于@yoheinakajima的BabyAGI[89]的AI代理,能执行shell命令自动编程,仅通过提供反馈就成功自动创建了一个应用。过程可在此处[90]找到。自动环境设置,成功在Linux容器中安装了Flutter环境,创建了Flutter应用,并启动了它。过程可在此处[91]找到。除了设置环境外,似乎还能处理一些常规任务,如生成文本,如诗歌、代码、剧本、音乐作品、电子邮件和信件,翻译语言[92]存在破坏环境的风险。请在Docker等虚拟环境中运行。推荐使用GPT-4或更高版本。

链接

创始人的Twitter[93]描述该系统的Twitter线索[94]




BabyFoxAGI[95]

带有新并行UI面板的BabyAGI修改版

类别

通用

描述

BabyElfAGI的一个修改版,属于按字母顺序命名的BabyAGI一系列修改版自我改进的任务列表(FOXY方法)

   - By storing a final reflection at the end, and pulling the most relevant reflection to guide future runs, BabyAGI slowly generates better and better tasks lists

新颖的聊天用户界面与并行任务功能

  - You can chat w BabyAGI! It has an experimental UI where the chat is separate from the tasks/output panel, allowing you to request multiple tasks in parallel  - The Chat UI can use a single skill quickly, or chain multiple skills together using a tasklist

新技能🎨 使用提示辅助的DALLE技能🎶 带有Deezer的音乐播放器📊 Airtable搜索(添加您自己的表/基础ID)🔍 创业分析师(作为技能的强大功能调用示例)它自己的自述文件

链接

作者的Twitter[96]描述系统的Twitter线索[97]Replit[98]

BambooAI[99]

为非程序员提供的数据探索和分析

类别

数据分析

描述

BambooAI会循环运行(直到用户决定结束)。允许混合使用具有不同能力、代币成本和上下文窗口的不同模型以完成不同的任务。保持之前对话的记忆。动态构建提示,利用Pinecone向量数据库中的相关上下文。根据需要提供叙述或提出后续问题。对于编码化的回应,任务被分解成一系列步骤,并构建一个伪代码算法。基于该算法,使用Python代码进行数据集分析、建模或绘图。调试代码,然后执行,必要时自动纠正,并向用户显示输出。对最终答案进行排名,并征求用户反馈。基于等级和用户反馈构建向量数据库知识库。

链接

GitHub[100]创建者的Twitter[101]




BeeBot[102]

早期项目,适用于广泛任务

类别

通用,生产力

描述

“BeeBot目前仍处于开发阶段,应被视为早期研究项目。目前它的焦点不在于生产使用。”

链接

GitHub[103]推文[104]

Bloop[105]

AI 代码搜索,适用于 Rust 和 Typescript

类别

编程

描述

一个由 GPT-4 驱动的语义代码搜索引擎,使用 AI 代理精确的代码导航基于堆栈图和作用域查询构建一个用 Rust 编写的快速代码搜索和正则表达式匹配引擎允许查找 Rust 和 Typescript 上的代码允许阶段性更改该代理使用自然语言、正则表达式和过滤查询,在您的本地和远程仓库中进行搜索Bloop 可以通过应用程序运行(通过 GitHub 轻松下载)GitHub[106]"入门"指南[107]Bloop 应用[108]

BondAI[109]

带有 CLI & RESTful/WebSocket API 的代码解释器

类别

编程

描述

一款高效能、自主的AI代理,配备易用的CLI、RESTful/WebSocket API、预构建的Docker镜像以及一整套强大的集成工具。支持所有GPT-N、嵌入式以及Dall-E OpenAI模型支持Azure OpenAI服务易于使用的SDK,可集成至任何应用程序强大的代码解释功能通过Postgres DB集成,实现强大的数据查询能力预构建的Docker镜像为代码生成/执行提供安全执行环境支持电话应用(通过BlandAI)支持股票交易(通过Alpaca Markets)与Gmail和Google搜索集成安装简便 pip install bondai启动CLI仅需运行 bondai启动RESTful/WebSocket API仅需运行 bondai --server

链接

BondAI 主页/文档[110]Github 仓库[111]Docker 镜像[112]




Cal.ai[113]

基于 Cal.com 构建的开源日程安排助手

类别

生产力

描述

Cal.ai 可以预订会议、总结您的一周,并根据自然语言找到与他人的会面时间。对未见过的任务灵活响应,例如:“将我倒数第二个会议移到明天上午”。底层使用了 GPT-4 和 LangChain Agent Executor。GitHub[114]

链接

作者:Cal.com 核心团队[115]Dexter Storey[116]Ted Spare[117]

CAMEL[118]

代理探索“心智”的架构

类别

通用

描述

CAMEL是一个开源库,旨在研究自治和交互式代理。1) AI用户代理:向AI助理提供完成任务的指令。

1.AI助理代理:遵循AI用户的指令并回应任务的解决方案

CAMEL还拥有一个致力于研究自治和交互式代理的开源社区

链接

网页[119]论文 - CAMEL: 为大规模语言模型社会的“心智”探索的交流代理[120]Colab 演示[121]GitHub[122]Hugging face 数据集[123]Slack[124]推特[125]作者: Guohao Li∗ Hasan Abed Al Kader Hammoud* Hani Itani* Dmitrii Khizbullin, Bernard Ghanem

ChatArena[126]




一个用于多代理交互的聊天工具

图片
image

类别

设计,自行构建,AI应用的SDK,多代理

描述

ChatArena(或Chat Arena)是一个面向大型语言模型(LLMs)的多智能体语言游戏环境。其目标是发展人工智能的沟通和协作能力。ChatArena提供:用于构建多个大型语言模型(LLMs)的交互环境的通用框架。一系列预构建或社区创建的环境。用户友好的界面,包括Web UI和命令行界面。

链接

网络[127]GitHub[128]X[129]Slack 频道[130]

ChatDev[131]

用于软件开发的交流型代理

类别

编码,多代理

描述

ChatDev是一家由多个智能代理驱动的虚拟软件公司,这些智能代理承担着不同的角色,如CEO、CPO、CTO、程序员、审核员、测试员和艺术设计师,每个角色都有独特的图标代表。这些代理在一个结构化的组织环境中协作,履行公司的使命:“通过编程革新数字世界。”他们参与专注于设计、编码、测试和文档的功能性研讨会。ChatDev旨在提供一个基于大型语言模型的可访问、模块化和可扩展的平台,便于在受控环境中研究集体智能。该框架允许进行广泛的自定义,使用户能够定制软件开发过程、定义阶段并在虚拟公司内确立特定角色。ChatDev致力于开源原则,鼓励社区贡献并透明地分享进展。

链接

论文 - ChatDev: 用于软件开发的交流代理[132]本地演示[133]GitHub[134]




ChemCrow[135]

用于化学相关任务的LangChain代理

类别

科学,化学

描述

ChemCrow是一个开源包,用于准确解决需要深度推理的化学任务它集成了13个专家设计的工具,以增强LLM在化学领域的表现,并展示了在自动化化学任务方面的有效性基于Langchain构建LLM被提供了一系列工具名称、它们的用途描述以及预期输入/输出的详细信息。然后,指导LLM使用所提供的工具回答用户给出的提示(如果需要)。指令建议模型遵循ReAct格式 - 思考、行动、行动输入、观察。一个有趣的观察是,尽管基于LLM的评估得出GPT-4和ChemCrow的表现几乎相当,但以解决方案的完成度和化学正确性为导向的人类专家评估显示,ChemCrow大幅度超过了GPT-4。这表明使用LLM评估其在需要深度专业知识的领域内的表现存在潜在问题。缺乏专业知识可能会导致LLM不知道自己的缺陷,因而不能很好地判断任务结果的正确性。(来源:Weng, Lilian. (2023年6月). "由LLM驱动的自主代理". Lil’Log. https://lilianweng.github.io/posts/2023-06-23-agent/.[136]

链接

论文[137]GitHub[138]HackerNews 讨论[139]




Clippy[140]

能够规划、编写、调试和测试代码的代理

类别

编码

描述

Clippy 的目的是帮助或与用户一起开发代码。它能够自主地规划、编写、调试和测试一些项目。对于更难的任务,最好的使用方式是查看它的工作并向它提供反馈。

链接

GitHub[141]作者:Lev Chizhov[142]




CodeFuse-ChatBot[143]

服务于整个软件开发生命周期的智能代理

图片

类别

编码

描述

一个智能助手,服务于整个软件开发生命周期,由多代理框架提供支持,与 DevOps 工具包、代码&文档仓库 RAG 等协同工作。

链接

GitHub[144]

Cody 由 ajhous44 开发[145]

查询和导航你的代码库

类别

编程

描述

一个旨在让你使用自然语言交互式查询代码库的AI助手。通过利用向量嵌入、分块以及OpenAI的语言模型,Cody可以帮助你以一种高效直观的方式浏览你的代码。GitHub[146]作者: @ajhous44[147] (Github)

Sourcegraph 的 Cody[148]

编写代码和回答问题的代理

类别

编程

描述

Sourcegraph 提供的一个 AI 代码助手,通过阅读您的整个代码库和代码图来为您编写代码和回答问题。

链接

GitHub[149]作者:@sourcegraph[150](Twitter)

Continue[151]

软件开发的开源自动驾驶仪

类别

编码

描述

一个为软件开发设计的开源自动驾驶仪——将ChatGPT的力量带入VS Code特点:回答编码问题用自然语言编辑从头生成文件网站[152]GitHub[153]文档[154]Twitter[155]

CrewAI[156]

用于编排角色扮演代理的框架

类别

自定义构建,代理SDK,多代理

描述

用于编排角色扮演、自主AI代理的尖端框架。通过促进协作智能,CrewAI赋予代理们无缝合作的能力,共同应对复杂任务。Crew AI是一个建立在LangChain之上的多代理框架,旨在使工程师能够利用AI代理的集体力量。与传统的自动化方法相比,Crew AI引入了一种新的协作决策、增强创造力和解决复杂问题的方法。Crew AI的设计理念提倡通过模块化实现简洁。它的主要组成部分包括代理、工具、任务、流程和团队。每个代理就像是团队成员,具有特定的角色、背景故事、目标和记忆。通过模块化设计,我们使复杂的AI代理世界变得容易访问、可管理且更具吸引力。

链接

GitHub[157]创始人的 X[158]博客文章:如何使用 Crew AI[159]Crew AI Wiki,包含示例和指南[160]文档[161]Discord[162]




Databerry[163]

(转向 Chaindesk)无代码聊天机器人构建

类别

自助构建

描述

一个超级简单的无代码平台,用于创建基于您自己数据训练的AI聊天机器人创建新代理、选择模型、数据和其他设置后,它们就可以部署到网站、Slack、Crisp或Zapier上了免费版本中的代理数量限制技术栈Next.jsJoy UILangchainJSPostgreSQLPrismaQdrant功能简化客户支持,引导新团队成员等从任何地方加载数据无代码:用户友好的界面,管理您的数据存储并与您的数据聊天用于查询数据的安全API端点自动同步数据源(即将推出)为每个数据存储自动生成一个ChatGPT插件

链接

文档[164]Discord[165]GitHub[166]




DemoGPT[167]

生成新应用程序(任何用途)的演示

类别

自建,通用

描述

DemoGPT 利用大型语言模型(LLMs)的力量,为应用程序提供快速而有效的演示创建。自动化原型设计过程,使其更加高效,节省宝贵时间。理解并处理给定提示,以生成相关应用程序。与 LangChain 集成,通过迭代解析 LangChain 的文档,并采用“变换树”(ToT)方法生成应用程序代码。DemoGPT 的路线图包括根据用户反馈和实际应用不断更新和改进,致力于完善技术并解决幻觉问题。“我们计划引入将进一步增强应用程序生成过程的功能,使其更加用户友好和高效。”

链接

Github[168]官网[169]Twitter[170]Streamlit 应用[171]Huggingface 空间[172]




DevGPT[173]

虚拟开发者团队

类别

编程,多代理

描述

告诉你的AI团队你想要构建的微服务,他们将为你实现。你的想象力是唯一的限制!!欢迎来到Dev-GPT,在这里,我们利用先进的人工智能技术将你的想法变为现实!我们的自动化开发团队旨在根据你的具体需求创建定制化的微服务,让你的软件开发过程变得无缝高效。由虚拟产品经理、开发人员和DevOps组成的AI团队确保你的项目从概念到部署的每一个环节都得到了覆盖。Discord[174]

Devika[175]

主动式人工智能软件工程师

图片
图片

类别

编程,通用目的

描述

Devika 是一名主动式人工智能软件工程师,能够理解高级人类指令,将其分解为步骤,研究相关信息,并编写代码以实现给定目标。Devika 旨在成为 Cognition AI 的 Devin 的有力开源替代品。

链接

GitHub[176]

德文[177]

开源的Devin替代品

类别

编程,通用

描述

Entropy研究的Devin的开源替代品

链接

GitHub[178]

DevOpsGPT[179]

AI驱动的软件开发自动化解决方案

图片
图片

类别

编程

描述

欢迎使用AI驱动的软件开发自动化解决方案,简称为DevOpsGPT。我们将大型语言模型(LLM)与DevOps工具结合起来,将自然语言需求转换为可运行的软件。这一创新特性大大提高了开发效率,缩短了开发周期,并减少了沟通成本,从而实现了更高质量的软件交付。

特性和优势

提高开发效率:无需繁琐的需求文件编写和解释。用户可以直接与DevOpsGPT互动,快速将需求转换为功能性软件。缩短开发周期:自动化软件开发过程显著减少交付时间,加速软件部署和迭代。降低沟通成本:通过准确理解用户需求,DevOpsGPT最小化了沟通错误和误解的风险,提高了开发和业务团队之间的协作效率。高质量交付物:DevOpsGPT生成代码并执行验证,确保交付软件的质量和可靠性。【企业版】现有项目分析:通过AI,自动分析现有项目信息,在现有项目的基础上准确分解和开发所需任务。【企业版】专业模型选择:支持在专业领域比GPT更强的语言模型服务,以更好地完成需求开发任务,并支持私有部署。【企业版】支持更多DevOps平台:可以连接更多DevOps平台,实现整个过程的开发和部署。

链接

创建者网站[180]演示视频[181]




dotagent[182]

在云端、PC或移动设备上部署代理

类别

自行构建

描述

一个代理管理系统,通过一套丰富的开发者工具,便于创建健壮的AI应用程序和实验性自主代理。支持在多个平台上部署代理,包括云端、PC或移动设备,并通过Python或纯英语集成扩展功能。通过强大的提示编译器推进提示工程,提供对语言模型更高程度的控制,显著优化响应生成过程。允许将代理无缝导出为可在任何环境执行的便携文件,同时提供一个可选的Agentbox特性,用于在沙盒环境中优化计算资源管理。

链接

YouTube视频[183]




英文编译器[184]

将markdown规范转换为功能代码

图片
图片

类别

编程

描述

OC人工智能编译器,用于将基于英文的markdown规格转换为功能性代码。“我们知道,所有伟大的™项目都始于详细的功能性规格说明,这通常是用英文或其它许多口语形式书写的。那么,如果我们不是从功能规格书写代码,而是直接将其编译成代码,会怎样呢?进入一个几乎一切都被书面文字替代的未来。”

链接

创建者的Twitter[185]

evo.ninja[186]

适应其任务以达成目标的AI代理

类别

通用目的、研究、多代理

描述

evo.ninja特别之处在于它能够根据手头的任务实时自我调整。Evo利用预定义的代理人格,这些人格针对特定任务领域量身定做。在evo的每次执行循环中,它会选择并采用最适合当前任务的人格。

链接

网页[187]GitHub[188]Discord[189]

星期五[190]




针对 Node.js 的 AI 开发者助手

图片
图片

类别

编程

描述

一款能够创建整个nodejs项目的开发者助手,拥有无限提示功能提供一个核心提示,用于构建应用程序的基础允许你添加无限多的部分,每个部分都是一个提示,代表应用程序的一个特定部分特征Friday使用GPT-4进行AI辅助,但已经过GPT-4-32k的测试和优化,以提高速度和获得更好的结果。它对于应用的基础需要2个小请求,每提供一个部分需要1个请求。Friday在幕后使用esbuild为其创建的每个应用程序。作者:Amirreza Salimi[191]

GeniA[192]

工程平台工程 AI 团队成员

类别

编程

描述

GeniA 能够在你的生产环境中与你并肩工作,在你的开发和云环境中代表你执行任务,例如 AWS/k8s/Argo/GitHub 等。允许你通过集成自己的工具和 API 来增强平台。Slack 应用程序机器人集成。支持 GPT-3.5 和 GPT-4。

链接

作者: Uri Shamay[193]Shlomi Shemesh[194]

Godmode[195]

受到AutoGPT和BabyAGI的启发,界面友好

类别

通用目的

描述

Godmode是一个受到Auto-GPT和BabyAGI启发的项目,通过友好的用户界面执行各种任务一个受到AutoGPT和BabyAGI启发的网络平台它能做什么:在星巴克订购咖啡进行市场分析寻找并协商租约支持GPT-3.5和GPT-4

链接

GitHub[196]作者:Emil Ahlbäck[197]Lonis[198]Discord[199]推文[200]




GPT Discord[201]

Discord的终极AI代理集成

类别

内容创作、生产力、通用目的、Discord

描述

GPT Discord是一个强大的、一体化的GPT接口,专为Discord设计。GPT Discord 支持从多模态图像理解、代码解释、高级数据分析、对自己文档的问答,到连接互联网与沃尔夫勒姆阿尔法和谷歌的聊天,AI 监控,通过 DALL-E 生成图像等多种功能!由 E2B 提供代码执行和环境操纵功能支持的 LLMs/模型提供者:OpenAI 模型

链接

GitHub[202]Kaveen Kumarasinghe - GPT Discord创始人 - 网站[203]Kaveen Kumarasinghe - GPT Discord创始人 - 领英[204]

GPT工程师[205]

根据提示生成整个代码库

类别

编程

描述

GPT工程师是一种AI代理,能够根据提示生成整个代码库。

模型:GPT 4描述您的项目,AI代理将请求澄清,然后构建整个代码库特性设计之初就易于适应、扩展,并使您的代理学习您希望代码呈现的样子。它根据提示生成整个代码库通过编辑identity文件夹中的文件,您可以指定AI代理的“身份”当前,通过编辑身份和演进主提示,是使代理在项目之间记住事物的方式steps.py中的每一步骤都会将其与GPT4的通信历史存储在logs文件夹中,并可以使用scripts/rerun_edited_message_logs.py重新运行

链接

网页[206]GitHub[207]Discord[208]作者:Anton Osika[209]由@Attack在Twitter上的评论[210]




GPT Migrate[211]

在不同框架/语言之间迁移代码库

类别

编程

描述

GPT Migrate 能够轻松地将您的代码库从一个框架或语言迁移到另一个。

从不同的大型语言模型(LLMs)中选择允许GPT迁移生成并运行新代码库的单元测试的能力能够选择迁移的源语言和目标语言能够自定义代理的工作流程(设置 -> 迁移 -> 测试)GPT迁移团队正在为代理添加基准测试[212]

链接

网站[213]作者:Josh Payne[214]公告[215]

GPT Pilot[216]

从头开始编写整个可扩展的应用程序

类别

编程

描述

GPT Pilot 是一个 AI 代理,它在你监督代码编写的过程中,编写整个应用程序的代码

一种开发工具,可以从零开始编写可扩展的应用程序,同时开发者监督实施过程一个研究项目,旨在探索如何利用GPT-4生成完全可运行的、准备投入生产的应用程序主要思想是AI可以编写应用程序的大部分代码(可能是95%),但对于剩下的5%,在我们实现完全的通用人工智能之前,仍然需要开发者的参与

链接

GitHub[217]Discord[218]

GPT 研究员[219]

一种代理,可以在任何主题上研究整个互联网

类别

研究,科学

描述

GPT 研究员是一个基于 GPT 的自主代理,可以对任何给定主题进行全面在线研究。

能够产出详尽、事实性且无偏见的研究报告提供定制选项,专注于相关资源、大纲和课程解决了速度和确定性的问题,通过并行化代理工作而不是同步操作,提供了更稳定的性能和提高的速度灵感来自于AutoGPT和Plan-and-Solve论文主要思想是运行“规划者”和“执行者”代理,其中规划者生成研究问题,执行者根据每个生成的研究问题寻找最相关的信息

链接

网站[220]Discord[221]作者:Assaf Elovic[222]

GPT Runner[223]

与您的文件对话的代理

类别

研究,科学

描述

与您选择的文件进行对话,无需嵌入、无需向量数据库!它还是一本 AI 提示故事书。您可以使用它与您的团队管理一些 AI 预设。它支持任何 IDE 和语言开发者。我们提供命令行界面来运行网络和 VSCode 扩展,Jetbrains 插件即将推出。隐私优先,所有数据都是本地的。我们同时支持 OpenAI 和 Anthropic(Claude-2)它支持多种语言。

链接

网站[224]作者:杨晋铭[225]

GPTSwarm[226]

语言代理作为可优化图

类别

自行构建(代理构建框架和平台),通用,多代理

描述

🐝 GPTSwarm 是一个基于图的框架,用于基于大型语言模型(LLM)的代理,提供两个高级特性:它让你能够从图中构建基于LLM的代理。它使得代理群体的定制化和自动自组织以及自我提升能力成为可能。已经提出了各种人类设计的提示工程技术,以改进基于大型语言模型(LLMs)的问题解决者,产生了许多不同的代码库。我们通过将基于LLM的代理描述为计算图来统一这些方法。每个节点实现一个函数来处理多模态数据或查询其他LLMs。每条边描述了操作和代理之间的信息流。图可以递归组合成更大的复合图,代表代理之间合作的层次结构。我们的新型自动图优化器(1)精细化节点级LLM提示(节点优化)和(2)通过改变图连通性改善代理协同作用(边优化)。实验表明,我们的框架可以用于有效地开发、集成并自动改进多样化的LLM代理。

链接

网页[227]GitHub[228]创始人的X(推特)[229]




IX[230]

代理构建、调试和部署平台

类别

自建,多代理

描述

IX是一个用于构建、调试和部署协作代理和认知工作流的平台。

IX是一个基于LangChain的代理平台,包括构建和部署协作完成任务的代理舰队所需的所有工具。IX既是编辑器也是运行时。编辑器是一种无代码图形式编辑器,用于设计代理、链、工具、检索函数和协作工作流。直观的图形式无代码编辑器。水平扩展的代理工作人员舰队。多用户、多代理聊天界面。智能输入自动完成 @提及 和 {文件} 引用。支持Chroma和其他向量数据库进行文档搜索。支持OpenAI API、Anthropic、PaLM和LLama基模型。组件库易于扩展。由LangChain驱动

链接

Youtube[231]Discord[232]作者的Twitter[233]

JARVIS[234]




连接LLMs与ML社区的系统

图片
image

类别

通用

描述

JARVIS是一个将LLMs与ML社区连接起来的系统。

任务规划:使用ChatGPT分析用户的请求来理解他们的意图,并将其拆分成可能的可解决任务。模型选择:为了解决规划的任务,ChatGPT基于它们的描述从Hugging Face托管的专家模型中选择。任务执行:调用并执行每个选定的模型,并将结果返回给ChatGPT。响应生成:使用ChatGPT集成所有模型的预测,并生成响应。

链接

论文[235]

Langroid[236]

多智能体框架用于构建LLM应用

类别

通用,自行构建

描述

Langroid是一个直观、轻量级、可扩展且有原则的Python框架,可以轻松构建由大型语言模型(LLM)驱动的应用程序。您可以设置代理,为它们配备可选组件(LLM、向量存储和方法),分配任务,并通过交换消息让它们协作解决问题。这种多代理范式受到了Actor Framework[237]的启发(但您不需要了解这方面的任何知识!)。 Langroid 是对 LLM 应用开发的全新尝试,其设计考虑了简化开发者体验;它不使用 Langchain

适用于大多数商业/远程和开放/本地的 LLM。设置多代理、多 LLM 系统:对于需要强大推理和遵循指令的代理,使用更强大的 LLM,将较简单的任务委托给较弱/本地的 LLM。支持OpenAI的函数调用以及一个名为ToolMessage的本地等效功能,后者适用于没有内置函数调用的LLMs。只需将结构指定为(嵌套的)Pydantic对象。内置功能齐全:用于RAG(检索增强生成)的向量数据库、缓存、日志/可观察性。提供专业代理:DocChatAgentSQLChatAgentTableChatAgent(用于表格数据,例如csv/dataframes)。DocChatAgent处理文本、PDF、Docx文件/URL,并采用了结合词汇和语义搜索的最先进技术进行检索。文档:langroid[238]

柠檬代理[239]

用于工作流自动化的计划-验证-解决代理

类别

生产力,编码

描述

柠檬代理是一个用于精确、可靠和可复制的工作流自动化的计划-验证-解决(PVS)代理

一种专门用于在GitHub、HubSpot或Airtable等各种工具上执行读写操作的独立监督计划和解决代理 (ACL 2023论文 "计划和解决提示:通过大型语言模型改善零次射击思维链推理[240]")任务和人在回路交互的分离:Lemon代理目前拥有一个计划代理和一个解决代理,以保持代理的专注并提高准确性。我们计划很快增加更多的代理。此外,Lemon代理将在相关工作流程步骤请求批准,以确保执行预期的操作。无限的配置选项:Lemon代理在定义工作流程时提供无限的配置选项(参见示例)。例如,您可以告诉Lemon代理在执行工作流程步骤之前请求权限,或者每次模型执行工作流程步骤时都讲一个🧔‍♀️爸爸笑话。UI灵活性:在顶部构建任何UI或通过内置的CLI与Lemon代理进行交互。[即将推出] 模型和框架不可知操作:Lemon代理是一个独立的代理,但可以轻松集成到像LangChain这样的框架中,并且可以与任何模型一起使用。额外福利:识别代理决策能力中的弱点,并通过进一步配置Lemon代理工作流程,移向更确定性的行为。(.html文件,无需任何额外安装即可运行)

链接

Discord[241]作者的Twitter[242]




LLM Agents[243]

用于构建代理,使用工具,规划的库

类别

编码

描述

一个简约的库,用于构建利用大型语言模型来通过命令循环和工具集成自动化任务的代理。

在REPL环境中执行Python代码。在Google和Hacker News上进行搜索。基于集成工具输出,遵循思考、行动、观察和新思考的循环过程。动态地向提示中追加新信息,以便由代理做出知情的决策。

链接

GitHub[244]博客[245]

LLM Stack[246]

无代码平台构建LLM代理

类别

构建您自己的无代码网络界面

描述

LLM Stack是一个无代码平台,用于利用您的数据构建LLM代理、工作流程和应用程序。LLMStack支持所有主要模型提供者,如OpenAI、Cohere、Stability AI、Hugging Face等。轻松使用这些模型构建强大的应用程序。通过LLM Stack,您可以构建生成式AI代理,如AI SDRs、研究分析师、RPA自动化等,无需编写任何代码。将代理连接到您的内部或外部工具,用代理搜索网络或浏览互联网。支持的LLM/模型提供者OpenAICohereStability AIHugging Face

链接

网络[247]GitHub[248]博客[249]

本地GPT[250]

在不泄露隐私的情况下与文件对话

类别

研究,数据分析,通用目的

描述

LocalGPT是一个开源项目,允许您在不泄露隐私的情况下与您的文件对话。受到privateGPT的启发,允许使用您自己的文件作为信息来源。

使用GPT模型在本地设备上与您的文档对话。没有数据离开您的设备,保证100%的隐私由于一切操作都在本地进行,您可以放心,没有任何数据会离开您的电脑与LocalGPT一起深入探索安全的本地文档互动世界readme上的大部分描述都受到了原始privateGPT的启发模型:Vicuna-7B使用InstructorEmbeddings嵌入式以及LLM都将在GPU上运行。如果您没有GPU,它也支持CPU使用Langchain构建

链接

GitHub[251]Subreddit[252]YouTube - LocalGPT:离线聊天用于你的文件【安装和代码演示】[253]

Loop GPT[254]

作为Python包重新实现的AutoGPT

图片
image

类别

通用

描述

Loop GPT 是对流行的 Auto-GPT 项目的重新实现,作为一个适当的 Python 包进行编写,设计时考虑了模块性和可扩展性。

语言:Python默认模型:GPT-3.5-turbo(也可以使用GPT-4)模块化Auto-GPT框架“即插即用”API - 可扩展且模块化的“Python式”框架,不仅仅是一个命令行工具特性“轻松添加新功能、集成和自定义代理能力,全部通过Python代码实现,无需繁琐的配置文件!”“最小化提示开销 - 每个令牌都至关重要。我们持续努力,以尽可能少的令牌数量获得最佳结果。”“人在循环中 - 能够通过人类反馈‘纠正’偏离轨道的代理。”“完整状态序列化 - 可以将代理的完整状态,包括记忆以及其工具的状态保存到文件或Python对象中。不需要外部数据库或向量存储(但仍然支持)!”

麦格[255]




为您的GitHub仓库提供自然语言工作流。

类别

编程、生产力、调试、多代理

描述

麦格是一个在新问题和拉取请求出现时运行的代码库代理。其核心功能包括标记、分配和回答问题。麦格能够搜索整个代码库,启动一个沙箱来运行脚本,甚至编写基础代码。

链接

网页[256]GitHub[257]视频 - 测试麦格[258]采访 - 关于构建麦格的创始人[259]X(推特)[260]创始人的X - Ted Spare[261]

Magick[262]

用于创建、部署、货币化代理的AIDE

类别

编码,代理SDK,自建

描述

Magick 是一个创建、部署、扩展和货币化有用的 AI 代理以及提示链接的 AIDE 工具。

一个全套的、与模型无关的 AIDE 工具,用于创建、部署、扩展和货币化有用的 AI 代理以及提示链接。Magick 允许在一个小时内构建像 BabyAGI 这样的东西。你可以实时观看图表执行,观察它执行时的思考过程,并理解流程。“自主代理的视觉开发即将到来。我们专门为认知架构的快速开发和可扩展的事件驱动自主代理构建了 Magick。”

链接

网站[263]GitHub[264]X[265]Discord[266]领英[267]创始人的领英 - Jesse Alton[268]创始人的领英 - Michael Sharpe[269]




MemGPT[270]

内存管理系统,为LLM提供上下文

类别

内存管理,数据分析

描述

一个智能管理不同内存层级的系统,在LLMs的有限上下文窗口内有效提供扩展的上下文。与你的数据交谈 - 对话你的本地文件或SQL数据库创建具有自我编辑记忆的永久性聊天机器人

链接

论文[271]文档[272]Discord[273]HuggingFace[274]

Mentat[275]

帮助您从命令行完成编码任务

类别

编码

描述

Mentat 是一款 AI 工具,可帮助您直接从命令行完成任何编码任务。与 Copilot 不同,Mentat 可以跨多个位置和文件协调编辑。与 ChatGPT 不同的是,Mentat 已经了解您项目的上下文 - 无需复制和粘贴!

链接

网站[276]Youtube[277]作者:Bio Bootloader[278] (Twitter)Discord 邀请[279]

MetaGPT[280]

返回设计、任务或仓库的代理框架

类别

多代理,编程,自建

描述

MetaGPT是一个多代理框架,给定一行需求,返回PRD、设计、任务或仓库。

MetaGPT允许为GPT分配不同角色,以形成一个合作的软件实体来完成复杂任务它接受一行需求作为输入,并输出用户故事/竞争分析/需求/数据结构/API/文档等。在内部,MetaGPT包括产品经理/架构师/项目经理/工程师它提供了软件公司的整个流程以及精心编排的SOPs。代码 = SOP(团队)是核心理念关于基于LLM的多代理工作的论文推进了自主代理相互协作以做到单独无法完成的更多事情的想法。MetaGPT将高效的人类工作流程作为一种元编程方法纳入基于LLM的多代理协作中

链接

GitHub[281]Discord[282]Twitter[283]论文 - MetaGPT: 针对多代理协作框架的元编程[284]




Mini AGI[285]

基于GPT-3.5 / GPT-4的通用代理

类别

通用用途

描述

MiniAGI 是基于 GPT-3.5 / GPT-4 的最简通用自主智能体能够分析股票价格、执行网络安全测试、创造艺术以及订购比萨MiniAGI 是一个与 GPT-3.5-Turbo 和 GPT-4 兼容的简单自主智能体它结合了强大的提示、最小化的工具集、思维链条和具有总结功能的短期记忆能够进行内部独白和自我批评

链接

GitHub[286]

多智能体辩论[287]

多智能体辩论论文实现

类别

通用,多智能体

描述

多智能体辩论是论文“通过多智能体辩论提高语言模型的事实性和推理能力”的实现。

本文阐述了我们如何将同一语言模型的不同实例视为一个“多代理社会”,在这个社会中,单个语言模型生成并评价其他实例的语言生成作者发现,经过这样的过程生成的最终答案在事实准确性和解决推理问题的准确性方面都有所提高通过在推理和事实有效性的不同领域中展示多代理辩论与单一代理生成之间的定量差异

链接

GitHub[288]项目页面[289]论文[290]

多GPT[291]

实验性多代理系统

类别

通用目的

描述

一项试验性的开源尝试,旨在使GPT-4完全自主化多个“专家GPT”协作完成任务每个专家都有自己的短期和长期记忆,并且能够相互通信特点设置任务并观察专家们开始工作。可以访问互联网进行搜索和信息收集长期和短期记忆管理用于文本生成的GPT-4实例可以访问流行的网站和平台使用GPT-3.5进行文件存储和总结

链接

演示[292]作者:Max Rumpf[293] 和 Significant Gravitas[294]

NLSOM[295]

基于自然语言的思维社会

类别

科学,多模态,社会,多代理

描述

基于自然语言的心智社会 - 包含代理社会和社区的概念包含代理社会和社区的概念代理可以是LLMs、基于NN的专家、API及角色扮演者。它们都通过自然语言进行交流。为了解决任务,这些代理使用一种名为“思维风暴”的协作过程,涉及相互采访。NLSOM的额外组件可以以模块化方式轻松添加。“是什么魔法让我们变得聪明?诀窍就是没有诀窍。智能的力量源自于我们巨大的多样性,而非任何单一、完美的原则。” — Marvin Minsky,《心智社会》,第308页

链接

GitHub[296]论文[297]作者 X - Jürgen Schmidhuber[298]作者 X - Mingchen Zhuge[299]




OpenAgents[300]

多智能体通用平台

图片
图片

类别

通用目的

描述

OpenAgents是一个开放平台,用于野生环境中的语言代理,为研究人员、开发人员和普通用户提供ChatGPT Plus副本。

以用户为中心聊天Web界面高效代理在线演示完全开源全栈易于部署可扩展大型语言模型(LLMs)工具代理方法

链接

GitHub[301]论文[302]演示[303]

OpenAGI[304]

研发代理平台

类别

通用型

描述

OpenAGI是一个开源的AGI研发平台,它能够支持代理执行基准任务和开放式任务。

由各种语言模型驱动,例如GPT-4、Vicuna、LLaMA和Flan-T5支持多模态工具学习和任务解决,如文本、图像、视频和音频支持将任务分解为线性任务解决方案和非线性任务解决方案允许进行基准任务解决和开放式任务解决提供易于使用的评估协议,以评估任务解决能力提供基于任务反馈的强化学习(RLTF),以允许代理持续自我改进

链接

GitHub[305]论文[306]演示[307]

OpenDevin[308]

OpenDevin:少写代码,创造更多

类别

编程,通用目的

描述

OpenDevin 项目源于复制、增强并超越原始 Devin 模型的愿望。通过吸引开源社区的参与,我们旨在解决 Code LLMs 在实际场景中面临的挑战,生产出对社区有重大贡献的作品,并为未来的进步铺平道路。

链接

GitHub[309]

Open Interpreter[310]

让 LLMs 执行代码的代码解释器

类别

编程

描述

Open Interpreter 是一个开源的解释器,能让LLMs在你的电脑上运行代码以完成任务

本地运行例如,可以总结PDFs,可视化数据集,控制你的浏览器通过类似ChatGPT的界面在你的终端上工作。

链接

网页[311]GitHub[312]作者的Twitter[313]

Pezzo[314]

用于提示管理等的开发工具包

类别

编码

描述

Pezzo 是一个开发工具包,旨在简化提示设计、版本管理、发布、协作、故障排除、可观察性等功能。

无论您是技术人员还是利益相关者,您都可以有效使用Pezzo。我们不认为AI提示应该在开发者的代码编辑器中设计。除了这种方法的技术问题外,它还阻碍了生产力。功能集中式提示管理:在一个地方管理所有AI提示,以获得最大的可见性和效率。简化的提示设计、发布和版本控制:轻松创建、编辑、测试和发布提示。可观察性:访问详细的提示执行历史、统计数据和指标(持续时间、提示成本、完成成本等),以获得更好的洞察力。故障排除:轻松解决您的提示问题。时间旅行以追溯性地微调失败的提示,并立即提交修复。成本透明性:获得所有提示和AI模型的全面成本透明性。简化集成:通过使用Pezzo客户端消费您的AI提示,无论模型提供者如何,都可减少90%的代码开销。

链接

文档[315]GitHub[316]




私有GPT[317]

用于与您的文档私密交互的工具

类别

研究,数据分析

描述

私有 GPT 是一个用于与文档私密交互的工具,无需互联网连接

使用LangChain、GPT4All、LlamaCpp、Chroma和SentenceTransformers构建一个测试项目,用于验证使用LLMs和向量嵌入实现完全私有化解决方案的可行性,尚未准备好投入生产

链接

GitHub[318]

PromethAI[319]

帮助营养和其他目标的AI代理

类别

生产力,通用

描述

“个性化AI助手,能够分解问题、提供解决方案,并让你使用代理行为自动化你的流程”特点

  - Helps users reach a solution by decomposing their requests into categories with a set of options (cuisine -> European)  - Has a dynamic UX/UI that helps avoid prompting  - Voice input supported  - Provides users with results of their queries and automates actions around them  - Remembers your past preferences and uses them to optimize your choices

科技由Langchain提供技术支持,可分解的异步提示 + 向量数据库 + Redis缓存使用Flutter + Dart构建的应用连接至Zapier NLP

链接

GitHub[320]网站[321]作者:Vasilije M[322]

React Agent[323]

开源的React.js自主LLM代理

类别

编码

描述

一个实验性的自主代理模型:GPT-4目的:从用户故事生成和组合React组件技术栈ReactTailwindCSSTypescriptRadix UIShandcn UIOpenAI API该代理从用户故事文本中生成和组合多个React组件,以生成相关屏幕,基于原子设计原则特点从用户故事生成React组件从现有组件组合React组件使用本地设计系统生成React组件使用React, TailwindCSS, Typescript, Radix UI, Shandcn UI基于原子设计原则构建它仍然是实验性的,但结果非常有趣,它是完全开源的,寻找贡献者!

链接

GitHub[324]文档[325]作者: Eylon Miz[326] 和 Lee Twito[327]




自操作计算机[328]

让多模态模型操作计算机

类别

生产力,研究

描述

使用与人类操作员相同的输入和输出,该模型观察屏幕并决定一系列鼠标和键盘操作以达到一个目标。

链接

网页[329]GitHub[330]

小型开发者[331]

你自己的初级AI开发者,通过E2B UI部署

类别

编程

描述

Smol 是您的初级开发人员。几秒钟内通过 e2b 部署[332]

以人为中心,连贯的整个程序合成您的初级开发人员允许开发、调试和反编译200 行代码,一半是英文100k 上下文可以总结内容和代码库Markdown 是最佳的提示 DSL将错误复制粘贴作为提示将 curl 输出复制粘贴作为提示通过描述您想要的编写 CSS 动画GPT4 >>> GPT3.5/Anthropic Claude 对于代码生成

链接

作者:Swyx[333]演示[334]推特[335]梗图[336]

Stackwise[337]

一款编写nodejs函数的VSCode扩展

分类

代理工具,编程

描述

Stackwise是一个VS Code扩展,它可以编写和导入nodejs函数,使您能够在不切换上下文的情况下编写代码。

开源函数集合描述你希望一个函数执行什么操作,AI即可构建它。Stackwise是一个VS Code扩展,它能自动编写并导入nodejs函数,让你可以在不切换上下文的情况下编写代码。不再为了集成API而寻找文档,也不用来回与ChatGPT对话。只需在你的代码中实现纯粹的功能!

链接

GitHub[338]X[339]创始人X - Wayne[340]创始人X - Silen Naihin[341]

Superagent[342]

允许无需编码即可创建代理的工具

类别

自建,通用,数据分析

描述

Superagent 不是单一的代理,而是一个允许无需编码即可创建代理的工具。

简化了LLM代理到生产环境的配置和部署“SuperAgent的核心原则之一是与任何第三方依赖和专有技术一起构建”它提供了一系列功能和工具,使开发者更容易地构建、管理和部署AI代理到生产环境,包括内置内存和通过向量数据库检索文档的功能、强大的工具、Webhooks、定时任务等。主要有两种类型的代理:行动代理和计划执行代理

链接

GitHub[343]文档[344]Discord[345]作者: Ismail Pelaseyed[346]采访:与Superagent创始人Ismail Pelaseyed讨论代理的追踪、可观察性和调试[347]博客文章:Superagent的Ismail和其他开发者预测AI代理未来的发展[348]

SuperAGI[349]

开发和部署AI代理的框架

类别

通用

描述

SuperAGI是一个开源的自主AI框架,旨在实现自主代理的开发和部署

人工智能代理框架开源,但基础设施是闭源的特点配置、生成和部署自治人工智能代理用工具扩展代理能力无缝运行并发代理图形用户界面动作控制台多个向量数据库多模态代理代理轨迹微调性能遥测优化的令牌使用代理内存存储循环检测启发式方法并发代理资源管理器

链接

YouTube[350]Discord[351]Subreddit[352]Twitter[353]作者:Ishaan Bhola[354]

怀疑代理[355]

关于不完全信息游戏的论文

图片
图片

类别

通用目的

描述

使用具有心智理论意识的GPT-4玩非完全信息游戏本文深入探讨了GPT-4学到的知识在非完全信息游戏中的适用性

链接

GitHub[356]论文[357]项目演示[358]游戏数据回放[359]

SWE Agent[360]

开源的Devin替代品

类别

编码,通用目的

描述

这个Devin替代品在FULL swe基准测试中得分为12.3%"一个开源的Devin在SWE Bench测试集的100%上获得12.29%,而Devin在25%的测试集上获得13.84%!"[361]SWE代理通过与一个专门的终端交互工作,这允许它:🔍 打开、滚动和搜索文件✍️ 编辑特定行并自动检查语法🧪 编写和执行测试这个自定义构建的界面对于良好的性能至关重要。仅仅将LM连接到一个普通的bash终端表现并不好。"我们的关键洞察是,LM需要精心设计的代理-计算机界面(类似于人类喜欢好的UI设计)。例如,当LM弄错缩进时,我们的编辑器会阻止它并提供反馈。"[362]SWE代理由普林斯顿NLP团队发布。使SWE代理特别的是,它在SWE-bench上的表现几乎和Devin一样好。重要的是要说,性能会根据代理使用的模型而变化[363]SWE代理与Devin相比的变化和创新包括:SWE代理中的代码通过Docker在本地执行。它使用“代理-计算机界面”(ACI)- 限制界面使得代理对于LM更容易使用。仅允许几个命令:运行代码、查找代码、编辑代码以及将更改提交到GitHub。代理写的任何代码在提交之前都会经过语法检查(linter)。如果语法不正确,代理会收到反馈并被迫重写代码。代理一次只能读取100行代码,而不是整个文件。这使得语言模型更容易理解代码。

链接

GitHub[364]网页[365]演示[366]Discord[367]




Sweep[368]

Github助手,用于修复问题和编写代码

类别

编程,GitHub

描述

Sweep是一个Github助手,帮助修复小错误和实现小功能

要安装,请点击安装按钮然后添加你想要的仓库,快速创建一个工单(例如,编写测试)在工单前加上“Sweep:”并让Sweep处理剩下的事情

链接

GitHub[369]Discord[370]访谈:Sweep 创始人分享从构建 AI 编码助手中学到的经验[371]提示 Sweep 的技巧[372]

Taxy AI[373]

Taxy AI 是一个完整的浏览器自动化工具

类别

通用用途,生产力

描述

Taxy 使用 GPT-4 来控制你的浏览器并代表你执行重复性动作目前它允许你定义特定的指令将来它还将支持保存和计划的工作流目前处于早期阶段,有等候名单

链接

GitHub[374]等候名单[375]

青少年人工通用智能[376]

受BabyAGI启发的智能体,能够回忆无限记忆

类别

通用

描述

一个受BabyAGI启发的智能体,能够回忆无限记忆,在采取行动之前“思考”,并且在被关闭后不会丢失记忆。

模型:GPT-4语言:Python利用OpenAI和Pinecone为AI代理提供记忆,并允许其在做出动作(输出文本)之前“思考”此外,仅仅通过关闭AI,并不会使其忘记其记忆,因为它存活在Pinecone上,其记忆计数器保存了它所在的索引每次用户查询AI时都会发生的过程:AI将查询向量化并存储在Pinecone向量数据库中AI查看其记忆,找到与当前查询相关的记忆和过去的查询AI思考采取什么行动AI存储第3步的思考基于第3步的思考和第2步中相关的记忆,AI生成输出AI将当前查询及其答案存储在其Pinecone向量数据库记忆中

链接

@sean_pixel[377]创建灵感来自论文《生成性代理:人类行为的交互式仿真》[378]




UFO[379]

一个专注于Windows操作系统界面的代理

类别

多代理,GUI代理

描述

微软出品的代理UFO是一个专注于UI的双代理框架,旨在通过无缝导航和操作一个或多个应用程序来满足Windows操作系统上的用户请求。

链接

GitHub[380]网页论文[381]

Vanna.AI[382]

基于 Python 的 AI SQL 代理,根据您的模式进行训练

类别

编码,调试,代码迁移,数据分析

描述

Vanna 是一个开源基于 Python 的 AI SQL 代理,根据您的模式进行训练,能在几秒钟内编写复杂的 SQL

由AI驱动的商业智能助手Vanna帮助您使用通过检索增强生成(Retrieval-Augmented Generation,简称RAG)的大型语言模型(LLMs)为您的数据库生成并运行准确的SQLVanna的工作分为两个简单步骤 - 在您的数据上训练一个RAG“模型”,然后提问,这将返回可以设置为自动在您的数据库上运行的SQL查询Vanna Python包和各种前端集成都是开源的Vanna的能力取决于您提供的训练数据。更多的训练数据意味着对于大型和复杂数据集更高的准确性您的数据库内容绝不会发送给LLM。元数据存储层只看到架构、文档和查询随着您越来越多地使用Vanna,随着我们增加您的训练数据,您的模型会持续改进

链接

网页[383]GitHub[384]Discord[385]领英[386]文档[387]




Voyager[388]

在Minecraft中受LLM驱动的终身学习代理

类别

通用目的

描述

一个在Minecraft中由LLM驱动的具身终身学习代理,能够持续探索世界、获取多样技能,并在没有人类干预的情况下做出新的发现Voyager包含三个关键组件:1. 一个自动化课程,最大化探索2. 一个不断增长的可执行代码技能库,用于存储和检索复杂行为3. 一个新的迭代提示机制,融合环境反馈、执行错误和自我验证以改进程序Voyager通过黑盒查询与GPT-4交互,这避免了对模型参数进行微调的需要

链接

GitHub[389]论文 - Voyager:一种结合大型语言模型的开放式具身智能体[390]YouTube视频[391]推文[392]




Web3 GPT[393]

编写并部署至EVM区块链的智能合约

类别

区块链、编程、生成应用、智能合约

描述

编写并部署智能合约到EVM区块链。连接钱包手动部署合约,甚至可以从旧的聊天记录中部署。使用账户抽象化和气体主账户,使得Web2/3用户无需专用的web3钱包即可与区块链交互。利用Chat-GPT与Web3-GPT功能进行交云和控制。

链接

Web[394]GitHub[395]创始人的X[396]创始人的LinkedIn[397]

“西部世界”仿真[398]




多智能体环境仿真库

类别

通用,多智能体

描述

一个多智能体仿真库,旨在模拟和优化具有多个交互智能体的系统和环境

斯坦福和谷歌的研究人员创建了一个交互式沙盒环境,其中包含25个可模拟人类行为的人工智能代理他们在公园散步,在咖啡馆聚会喝咖啡,与同事分享新闻。他们展示了出人意料的良好社交能力《西部世界》的灵感来源于Unity软件和Unity ML 代理,这些都是用Python改编的语言该库可通过pip install westworld在PyPi上获取Javascript版本(正在开发中)[399]特点轻松创建网格和非网格环境对象(代理,障碍物,可收集物,触发器)不同对象的子类化以创建自定义对象Spawner用于在环境中随机生成对象所有对象的基本刚体系统简单的代理行为(寻路,漫游,随机行走,逃跑,视野范围)自动迷宫生成层集成,将图像转换为障碍物并将其对齐到网格经典模拟的样本模拟和样本代理模拟可视化,回放和导出(gif或视频)

链接

GitHub[400]文档[401]基础论文 - 生成式代理[402]一篇模拟数十代理间互动的论文提出一种架构,该架构扩展了语言模型以存储和合成代理的经验,使其能够在一个带有生成式代理的交互式沙盒环境中进行动态行为规划

WorkGPT[403]

用于调用API的GPT代理框架

类别

编程

描述

WorkGPT 是一个类似于 AutoGPT 或 LangChain 的代理框架。你只需要给它一个指令和一系列的 API,它就会与 AI 进行来回对话,直到完成其指令。例如,一个指令可以是在网上进行研究,爬取一个网站,或者为你叫一辆 Uber。我们支持所有可以用 OpenAPI 文件表示的 API。WorkGPT 现在内置了 OpenAI 的新功能调用特性虽然在此之前(参见 AutoGPT)也可以将多个 API 链接在一起,但那样做往往缓慢、成本高昂且容易出错宣布此功能的推文[404]

链接

作者: Alex MacCaw[405]




XAgent[406]

实验性的LLM代理,可解决各种任务

类别

通用,编程

描述

XAgent 是一个开源的实验性大型语言模型(LLM)驱动的自主代理,能够自动解决各种任务

出现与自主性:XAgent的自主操作超越了偏见。安全与操作:在docker环境中安全执行。无需专家知识:无需完全依赖专家即可有效操作。界面与交互:通过用户友好的GUI或命令行进行交互,同时它能适应和协作。双循环机制外循环:管理计划和任务细化。内循环:派发,基于ReACT的执行,反馈。通用语言 - 函数调用ToolAgent & ReACT:子任务的最佳动作序列。工具📝 文件编辑器📘 Python笔记本🌏 网络浏览器🖥️ 命令行界面🧩 快速API

链接

Twitter[407]GitHub 仓库[408]Discord[409]Youtube 演示


AI 前线

OpenAI、Gemini 和 Claude 如何利用智能体赋能深度研究

2025-12-23 22:55:26

AI 前线

DeepSeek 创始人专访:中国的 AI 不可能永远跟随,需要有人站到技术的前沿

2025-12-23 22:58:01

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索