Agent 设计模式 - 常见问题解答 常见问题解答:Agentic 设计模式 什么是"Agentic 设计模式"? Agentic 设计模式是可复用的高层解决方案,用于应对构建智能自主系统(Agent)时的常见挑战。这些模式为设计 Agent 行为提供结构化框架,其作用类似于传统编程中的软件设计模式。它们助力开发者构建更稳健、可预测且高效的 AI Agent。 本指南的核心目标是什么? 本指南致力于提供设计与构建 Agentic 2025-11-30 Agent 设计模式 #笔记摘抄 #agent
Agent 设计模式 - 01 提示词链 第 1 章:提示词链 提示词链模式概述 提示词链(Prompt Chaining),有时称为管道模式(Pipeline pattern),是利用大型语言模型(LLM)处理复杂任务时的强大范式。该方法摒弃了让LLM在单一整体化步骤中解决复杂问题的做法,采用分而治之策略:将原始复杂问题分解为更小、更易管理的子问题序列,每个子问题通过专门设计的提示词单独处理,输出作为输入传递给链中后续提示词。 这 2025-11-30 Agent 设计模式 #笔记摘抄 #agent
Agent 设计模式 - 目录总览 Agent 设计模式 构建智能系统的实战指南,作者:[Antonio Gulli] 第一部分:核心模式(103页) 提示链(12页) 路由决策(13页) 并行执行(15页) 反思优化(13页) 工具调用(20页) 任务规划(13页) 多 Agent 协作(17页) 第二部分:认知机制(61页) 记忆管理(21页) 学习与适应(12页) 模型上下文协议(MCP) 2025-11-30 Agent 设计模式 #笔记摘抄 #agent
Agent实践经验总结 人工智能 Agent 的浪潮正席卷而来,它承诺了一个能够自主理解、规划并执行复杂任务的未来。然而,从酷炫的 Demo 到稳定可靠的生产环境应用,中间隔着一道巨大的鸿沟。构建一个真正高效、稳定且经济的 Agent,其实是一场回归工程本质的实践。 2025-09-21 categories #agent #llm #总结
RL数据合成框架--Synthetic Data RL 尽管如GPT-4和Gemini等基础模型已在通用语言理解方面设立了新的行业标杆 ,但它们在需要深度领域知识的专业领域中,其表现常常不尽如人意。 当面临数学、医学、法律及金融等专门任务时,这些模型时常表现不佳,因为这些领域高度依赖特定的专业知识。 传统上,为了让这些模型适应特定领域,最直接的方法是使用大规模的人类标注数据进行微调。然而,这一过程不仅成本高昂、耗时漫长,而且在许多实际应用场景中 2025-07-20 categories #强化学习 #数据生成 #论文项目
强化学习、PPO与GRPO简明入门 从InstructGPT (2022.1)到Deepseek R1(2024.4),从RLHF到GRPO,强化学习在LLM领域愈发重要,本文简单说明了强化学习中的一些常见概念,包括策略函数、优势函数、KL散度惩罚、PPO与GRPO,供大家简单入门 2025-04-05 强化学习 #笔记整理 #LLM #强化学习
基于python的MCP使用简单教程 MCP是一种新型的agent通信协议,其突出贡献是统一了各模型厂商的function call各不相同的局面。这里基于windows11 和python 3.11环境对MCP的使用作简单示例(模型调用的是类openai API的格式,现在各大厂商一般都支持)。 接下来让我们5分钟上手mcp: 2025-03-22 categories #AI系统 #智能体协议 #mcp
AI技术在NLP领域的演进与实践 引言 在人工智能技术快速发展的今天,我们见证了一场前所未有的技术革命。从最初的机器学习算法到如今风靡全球的大语言模型(LLM),AI技术正在以惊人的速度重塑着我们的工作和生活方式。 本文将带领大家循序渐进地探索AI技术的演进历程和实践应用。分享分为两部分,第一部分主要是从机器学习的基础概念出发,解析其如何一步步发展成为今天强大的语言模型,并针对具体任务给出一个简单示例。第二部分我们将深入剖析L 2025-03-10 categories #AI技术梳理 #NLP技术 #笔记整理
一文读懂Celery与RabbitMQ分布式任务调度系统 Celery结合RabbitMQ,可用于AI任务的异步处理、分布式计算、任务调度,广泛应用于模型推理、训练管理、数据预处理等场景。RabbitMQ 负责任务分发,Celery Worker 并行执行,提高系统吞吐量,支持负载均衡、任务重试、定时调度,确保AI任务高效稳定运行,适用于大规模计算和高并发请求处理。 2025-03-01 categories #笔记整理 #后端调度 #AI系统
DeepSeek-V3技术报告 近年来,LLM 经历了快速迭代和演进,逐步缩小了与通用人工智能(AGI)的差距。除了闭源模型外,开源模型阵营也在取得重大进展,包括 DeepSeek 系列、LLaMA 系列、Qwen 系列和 Mistral 系列,这些模型正在努力缩小与闭源模型的性能差距。 为了进一步突破开源模型的能力边界,研究团队开发了 DeepSeek-V3,这是一个基于 MoE 架构的大模型,总参数量达到 671B,其中每 2025-02-06 categories #LLM #论文精读