我的AI产品探索之旅

引言

从2024年基于RAG的智能客服系统，到2025年Q3的Agent智能体探索，再到Q4强推理模型下的范式转移，这是一段关于AI产品从"策略架构"到"自主推理"的完整演进路径。本文将分享这三个阶段的核心实践、遇到的挑战以及最终找到的解决方案。

阶段一：基于 RAG 的智能客服&AI润色文案（2024）

在这个阶段，你的角色更像是 "AI 策略架构师"。你不是在写代码，而是在设计一套信息过滤与调教的机制。

1. 知识库建设：从"堆料"到"精炼"

知识库的质量决定了 AI 表现的上限（Garbage in, Garbage out）。

格式转换： 将 PDF、Word、HTML 统一转化为 Markdown，去除冗余的页眉页脚和乱码。

Chunking 策略： 不是简单的按字数切分，而是基于语义段落（Heading-based）切分，确保每个分块（Chunk）逻辑完整。

2. 提示词工程（Prompt Engineering）：建立边界

客服场景下，AI 的稳定性和合规性远比创造力重要。

角色设定 (Role)： "你是一个专业且有温度的 [品牌名] 客服专家。"

任务约束 (Constraints)：

"仅使用检索到的 Context 回答，严禁幻觉。"
"如果知识库中没有答案，请引导用户联系人工客服。"

输出格式 (Format)： 要求使用 Markdown 列表提高可读性。

少样本引导 (Few-shot)： 提供 2-3 对标准"Q&A"范例，让 AI 模仿语气和逻辑。

场景介绍

1. 效能分析摘要（Efficiency Analytics）

输入： 原始的研发工时、任务状态、代码提交量、Bug 修复率等数据。

AI 的处理逻辑：

异常识别： 识别数据中的"离群值"（例如：某个 Sprint 的 Bug 解决时间异常长）。
归因建议： 不只是说"进度慢了"，而是通过关联任务描述，总结出"慢"的原因（如：需求变更频繁或技术债务过多）。
行动项生成： 将枯燥的仪表盘数据转化为 3 条可执行的改进建议。

2. 月报总结提炼（Monthly Reports）

挑战： 月报内容通常碎片化、流水账，缺乏逻辑深度。

AI 的处理逻辑：

由点及面： 将 20 条零散的工作记录，按照"业务增长"、"系统稳定性"、"团队建设"等维度进行聚类。
风格对齐： 将不同成员口语化的描述，统一润色为符合公司文化的专业书面语（例如：从"修了好多 Bug"优化为"系统可用性提升了 15%，解决了 3 个核心链路的顽固故障"）。

第二阶段：2025 年Q3 —— Agent 智能体的"深水区探索"

随着行业内 Agent 框架成熟和 MCP 协议的出现，你开始在"研发效能驾驶舱"中搭建具备自主推理能力的智能分析 Agent。

1. MCP 架构的引入与初步尝试

工程实现： 将原有的 API 接口封装为 MCP 工具，让模型可以直接触达实时数据库（Git、Jira 等）。

早期结果：

单步骤查询（如：查某个指标）逻辑通顺。
复杂下钻场景失效：模型在处理长链条推理时经常"吞掉"中间的工具执行步骤。

2. "百个工具"危机与治理重构

遇到的痛点：

工具过载： 当指标下钻工具超过 100 个时，模型频繁调错工具。
上下文崩溃： 100 个工具的描述占满了模型的 Context Window（在 Cursor 中频发告警）。

重构策略（治理三板斧）：

工具分组： 增加命名空间前缀（如 quality_）。
场景合并： 弃用原子化 API，将相关指标合并为"通用场景工具"，由模型通过传参来选择维度。
精细化设计： 重新定义工具的 Name、Description、Input（极简）和 Output（提纯）。

第三阶段：2025 年 Q4 —— 强推理模型下的"范式转移"

你迎来了技术架构的成熟期，通过模型升级与设计哲学的反思，找到了 Agent 落地的最优解。

1. 核心决策：Claude 3.7 + 弱提示词策略

基座升级： 从依赖 SOP 的 GPT-4o mini 升级为具备强大思维链（Thinking Process）的 Claude 3.7。

设计哲学转变：

弱化系统提示词： 仅保留工具规则，不再强行规定分析的 SOP 路径。
强化工具说明： 依靠模型自身的推理能力去自发组合工具。

关键发现： 过于复杂的 System Prompt 会压制模型灵活性，减弱用户的自主探索体验。

2. 二元路径的深度思考

路径 A：Cursor 专家模式（上限极高）

利用细粒度工具和 Slash Command 自动化复杂任务。
认知： 强工程能力 + 强模型可以实现"全能 Agent"，但对使用者的素质（Prompt 架构能力）要求极高。

路径 B：自研框架集成模式（确定性高）

针对公司基建较弱的现实，通过"固定场景工具"和"产品流程深度融合"来保证稳定性。
认知： 不必追求全能，将 Agent 嵌入现有流程（Trigger-based）是 B 端产品落地的更佳路径。

结论：从策略架构到自主推理的演进

回顾这三个阶段的探索，你会发现 AI 产品的落地并非一蹴而就。从 RAG 时代的知识库精炼与提示词边界设定，到 Agent 时代的工具治理与架构重构，再到强推理模型下的设计哲学转变，每一步都需要在"能力上限"与"落地确定性"之间找到平衡。

核心启示：

知识库质量决定上限：无论技术如何演进，数据质量始终是基础。
工具治理是规模化前提：当工具数量超过临界点，必须通过分组、合并、精细化设计来维持可控性。
设计哲学需要匹配模型能力：强推理模型下，弱化 SOP、强化工具说明，让模型自主推理往往比强行规定路径更有效。
路径选择要匹配组织能力：Cursor 专家模式上限高但门槛也高；自研框架集成模式确定性高，更适合 B 端产品落地。

AI 产品的探索之路仍在继续，但我们已经找到了从"策略架构"到"自主推理"的清晰路径。