记录从文章、视频中学习到的 AI Agent 内容。
起源:LLM
LLM进化树:
![[Pasted image 20250108193022.png]]
- 基于 Transformer 的模型显示为非灰色颜色
- 仅解码器模型显示为蓝色分支(目前集中到 GPT(闭源)和 LLaMa(开源)两个模型上),擅长“预测下一词”
- 仅编码器模型显示为粉红色分支,擅长“完形填空”
- 而编码器-解码器模型显示为绿色分支
- 时间轴上模型的垂直位置代表其发布日期
- 开源模型由实心方块表示, 而闭源模型由空心方块表示
- 右下角的堆叠条形图显示来自各公司和机构的模型数量
- 论文:[2304.13712] Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond
- GitHub:Mooler0410/LLMsPracticalGuide: A curated list of practical guide resources of LLMs (LLMs Tree, Examples, Papers)
从 LLM 到 AI Agent
通过引入行动能力、长期记忆机制和工具整合功能,AI Agent 能弥补当前大模型的不足,使其不仅能回答问题,还能真正去“做”事情。
忽略 Agent 感知和环境的反馈,得到 OpenAI 的模型图:
- 使用框架构建 Agent 系统:LangChain
- 工具:LLM 通过使用工具与外部数据和服务进行交互,使 Agent 访问和处理现实世界的信息,即:工具弥合了智能体内部功能和外部世界的差距。工具的形式通常与 Web API(GET、POST、PUT、DELETE)保持一致。
通用 Agent 架构和组件:
- 模型
- 工具
- 编排层:循环过程,是 Agent 的核心。负责维护记忆、状态、推理和计划。
模型能够与之交互的工具类型:扩展、函数、数据存储(向量数据库)