构建高效代理

在最近的一篇研究论文《构建高效智能体》中，Anthropic 分享了关于构建高效大型语言模型（LLM）智能体的宝贵见解。这项研究特别有趣的地方在于，它强调简单性和可组合性，而非复杂的框架。让我们探讨如何使用 Spring AI 将这些原则转化为实际的实现。

虽然模式描述和图表来源于 Anthropic 的原始出版物，但我们将重点关注如何使用 Spring AI 的模型可移植性和结构化输出功能来实现这些模式。我们建议首先阅读原始论文。

spring-ai-examples 仓库中的 agentic-patterns 目录包含了以下所有示例的代码。

智能体系统

该研究论文对两种类型的智能体系统进行了重要的架构区分

工作流：LLM 和工具通过预定义代码路径（例如，规范性系统）进行协调的系统
智能体：LLM 动态指导其自身流程和工具使用的系统

关键的见解是，虽然完全自主的智能体可能看起来很有吸引力，但工作流通常能为明确定义的任务提供更好的可预测性和一致性。这与企业对可靠性和可维护性的关键要求完全一致。

让我们研究 Spring AI 如何通过五个基本模式实现这些概念，每种模式都服务于特定的用例

1. 链式工作流

链式工作流模式体现了将复杂任务分解为更简单、更易管理步骤的原则。

何时使用： - 具有清晰顺序步骤的任务 - 当您希望以延迟换取更高准确性时 - 当每个步骤都建立在前一个步骤的输出之上时

以下是 Spring AI 实现的一个实际示例

public class ChainWorkflow {
    private final ChatClient chatClient;
    private final String[] systemPrompts;

    public String chain(String userInput) {
        String response = userInput;
        for (String prompt : systemPrompts) {
            String input = String.format("{%s}\n {%s}", prompt, response);
            response = chatClient.prompt(input).call().content();
        }
        return response;
    }
}

此实现演示了几个关键原则

每个步骤都具有集中的职责
一个步骤的输出成为下一个步骤的输入
链式结构易于扩展和维护

2. 并行化工作流

LLM 可以同时处理任务，并通过编程方式聚合它们的输出。

何时使用： - 处理大量相似但独立的项时 - 需要多个独立视角的任务 - 当处理时间至关重要且任务可并行化时

List<String> parallelResponse = new ParallelizationWorkflow(chatClient)
    .parallel(
        "Analyze how market changes will impact this stakeholder group.",
        List.of(
            "Customers: ...",
            "Employees: ...",
            "Investors: ...",
            "Suppliers: ..."
        ),
        4
    );

3. 路由工作流

路由模式实现了智能任务分发，为不同类型的输入提供专门处理。

何时使用： - 具有不同输入类别的复杂任务 - 当不同输入需要专门处理时 - 当分类能够准确处理时

@Autowired
private ChatClient chatClient;

RoutingWorkflow workflow = new RoutingWorkflow(chatClient);

Map<String, String> routes = Map.of(
    "billing", "You are a billing specialist. Help resolve billing issues...",
    "technical", "You are a technical support engineer. Help solve technical problems...",
    "general", "You are a customer service representative. Help with general inquiries..."
);

String input = "My account was charged twice last week";
String response = workflow.route(input, routes);

4. 协调器-工作器

何时使用： - 无法预先预测子任务的复杂任务 - 需要不同方法或视角的任务 - 需要自适应问题解决的情况

public class OrchestratorWorkersWorkflow {
    public WorkerResponse process(String taskDescription) {
        // 1. Orchestrator analyzes task and determines subtasks
        OrchestratorResponse orchestratorResponse = // ...

        // 2. Workers process subtasks in parallel
        List<String> workerResponses = // ...

        // 3. Results are combined into final response
        return new WorkerResponse(/*...*/);
    }
}

使用示例

ChatClient chatClient = // ... initialize chat client
OrchestratorWorkersWorkflow workflow = new OrchestratorWorkersWorkflow(chatClient);

WorkerResponse response = workflow.process(
    "Generate both technical and user-friendly documentation for a REST API endpoint"
);

System.out.println("Analysis: " + response.analysis());
System.out.println("Worker Outputs: " + response.workerResponses());

5. 评估器-优化器

何时使用： - 存在明确的评估标准 - 迭代改进提供可衡量的价值 - 任务受益于多轮批评

public class EvaluatorOptimizerWorkflow {
    public RefinedResponse loop(String task) {
        Generation generation = generate(task, context);
        EvaluationResponse evaluation = evaluate(generation.response(), task);
        return new RefinedResponse(finalSolution, chainOfThought);
    }
}

使用示例

ChatClient chatClient = // ... initialize chat client
EvaluatorOptimizerWorkflow workflow = new EvaluatorOptimizerWorkflow(chatClient);

RefinedResponse response = workflow.loop(
    "Create a Java class implementing a thread-safe counter"
);

System.out.println("Final Solution: " + response.solution());
System.out.println("Evolution: " + response.chainOfThought());

Spring AI 实现的优势

Spring AI 对这些模式的实现提供了与 Anthropic 建议一致的几个好处

模型可移植性

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-openai-spring-boot-starter</artifactId>
</dependency>

结构化输出

EvaluationResponse response = chatClient.prompt(prompt)
    .call()
    .entity(EvaluationResponse.class);

一致的 API

跨不同 LLM 提供商的统一接口
内置错误处理和重试
灵活的提示管理

最佳实践和建议

从简单开始
在增加复杂性之前，从基本工作流开始
使用满足您需求的最简单模式
仅在需要时增加复杂性
为可靠性设计
实现清晰的错误处理
尽可能使用类型安全的响应
在每个步骤中构建验证
考虑权衡
平衡延迟与准确性
评估何时使用并行处理
在固定工作流和动态智能体之间做出选择

未来工作

这些指南将进行更新，以探讨如何构建更高级的智能体，将这些基础模式与复杂功能相结合

模式组合 - 组合多种模式以创建更强大的工作流 - 构建混合系统以利用每种模式的优势 - 创建可适应不断变化需求的灵活架构

高级智能体内存管理 - 实现跨对话的持久内存 - 高效管理上下文窗口 - 开发长期知识保留策略

工具和模型-上下文协议 (MCP) 集成 - 通过标准化接口利用外部工具 - 实现 MCP 以增强模型交互 - 构建可扩展的智能体架构

结论

Anthropic 的研究见解与 Spring AI 的实际实现相结合，为构建高效的基于 LLM 的系统提供了强大的框架。

通过遵循这些模式和原则，开发人员可以创建健壮、可维护和高效的 AI 应用程序，在避免不必要的复杂性的同时提供真正的价值。

关键是要记住，有时最简单的解决方案是最有效的。从基本模式开始，彻底理解您的用例，并且只在它能显著改善系统性能或功能时才增加复杂性。