返回文章列表

我的AI产品探索之旅

15 分钟
AI编程RAGAgentMCP
我的AI产品探索之旅

我的AI产品探索之旅

引言

从2024年基于RAG的智能客服系统,到2025年Q3的Agent智能体探索,再到Q4强推理模型下的范式转移,这是一段关于AI产品从"策略架构"到"自主推理"的完整演进路径。本文将分享这三个阶段的核心实践、遇到的挑战以及最终找到的解决方案。


阶段一:基于 RAG 的智能客服&AI润色文案(2024)

在这个阶段,你的角色更像是 "AI 策略架构师"。你不是在写代码,而是在设计一套信息过滤与调教的机制。

1. 知识库建设:从"堆料"到"精炼"

知识库的质量决定了 AI 表现的上限(Garbage in, Garbage out)。

格式转换: 将 PDF、Word、HTML 统一转化为 Markdown,去除冗余的页眉页脚和乱码。

Chunking 策略: 不是简单的按字数切分,而是基于语义段落(Heading-based)切分,确保每个分块(Chunk)逻辑完整。

2. 提示词工程(Prompt Engineering):建立边界

客服场景下,AI 的稳定性和合规性远比创造力重要。

角色设定 (Role): "你是一个专业且有温度的 [品牌名] 客服专家。"

任务约束 (Constraints):

  • "仅使用检索到的 Context 回答,严禁幻觉。"
  • "如果知识库中没有答案,请引导用户联系人工客服。"

输出格式 (Format): 要求使用 Markdown 列表提高可读性。

少样本引导 (Few-shot): 提供 2-3 对标准"Q&A"范例,让 AI 模仿语气和逻辑。

场景介绍

1. 效能分析摘要(Efficiency Analytics)

输入: 原始的研发工时、任务状态、代码提交量、Bug 修复率等数据。

AI 的处理逻辑:

  • 异常识别: 识别数据中的"离群值"(例如:某个 Sprint 的 Bug 解决时间异常长)。
  • 归因建议: 不只是说"进度慢了",而是通过关联任务描述,总结出"慢"的原因(如:需求变更频繁或技术债务过多)。
  • 行动项生成: 将枯燥的仪表盘数据转化为 3 条可执行的改进建议。

2. 月报总结提炼(Monthly Reports)

挑战: 月报内容通常碎片化、流水账,缺乏逻辑深度。

AI 的处理逻辑:

  • 由点及面: 将 20 条零散的工作记录,按照"业务增长"、"系统稳定性"、"团队建设"等维度进行聚类。
  • 风格对齐: 将不同成员口语化的描述,统一润色为符合公司文化的专业书面语(例如:从"修了好多 Bug"优化为"系统可用性提升了 15%,解决了 3 个核心链路的顽固故障")。

第二阶段:2025 年Q3 —— Agent 智能体的"深水区探索"

随着行业内 Agent 框架成熟和 MCP 协议的出现,你开始在"研发效能驾驶舱"中搭建具备自主推理能力的智能分析 Agent。

1. MCP 架构的引入与初步尝试

工程实现: 将原有的 API 接口封装为 MCP 工具,让模型可以直接触达实时数据库(Git、Jira 等)。

早期结果:

  • 单步骤查询(如:查某个指标)逻辑通顺。
  • 复杂下钻场景失效:模型在处理长链条推理时经常"吞掉"中间的工具执行步骤。

2. "百个工具"危机与治理重构

遇到的痛点:

  • 工具过载: 当指标下钻工具超过 100 个时,模型频繁调错工具。
  • 上下文崩溃: 100 个工具的描述占满了模型的 Context Window(在 Cursor 中频发告警)。

重构策略(治理三板斧):

  • 工具分组: 增加命名空间前缀(如 quality_)。
  • 场景合并: 弃用原子化 API,将相关指标合并为"通用场景工具",由模型通过传参来选择维度。
  • 精细化设计: 重新定义工具的 Name、Description、Input(极简)和 Output(提纯)。

第三阶段:2025 年 Q4 —— 强推理模型下的"范式转移"

你迎来了技术架构的成熟期,通过模型升级与设计哲学的反思,找到了 Agent 落地的最优解。

1. 核心决策:Claude 3.7 + 弱提示词策略

基座升级: 从依赖 SOP 的 GPT-4o mini 升级为具备强大思维链(Thinking Process)的 Claude 3.7。

设计哲学转变:

  • 弱化系统提示词: 仅保留工具规则,不再强行规定分析的 SOP 路径。
  • 强化工具说明: 依靠模型自身的推理能力去自发组合工具。

关键发现: 过于复杂的 System Prompt 会压制模型灵活性,减弱用户的自主探索体验。

2. 二元路径的深度思考

路径 A:Cursor 专家模式(上限极高)

  • 利用细粒度工具和 Slash Command 自动化复杂任务。
  • 认知: 强工程能力 + 强模型可以实现"全能 Agent",但对使用者的素质(Prompt 架构能力)要求极高。

路径 B:自研框架集成模式(确定性高)

  • 针对公司基建较弱的现实,通过"固定场景工具"和"产品流程深度融合"来保证稳定性。
  • 认知: 不必追求全能,将 Agent 嵌入现有流程(Trigger-based)是 B 端产品落地的更佳路径。

结论:从策略架构到自主推理的演进

回顾这三个阶段的探索,你会发现 AI 产品的落地并非一蹴而就。从 RAG 时代的知识库精炼与提示词边界设定,到 Agent 时代的工具治理与架构重构,再到强推理模型下的设计哲学转变,每一步都需要在"能力上限"与"落地确定性"之间找到平衡。

核心启示:

  1. 知识库质量决定上限:无论技术如何演进,数据质量始终是基础。
  2. 工具治理是规模化前提:当工具数量超过临界点,必须通过分组、合并、精细化设计来维持可控性。
  3. 设计哲学需要匹配模型能力:强推理模型下,弱化 SOP、强化工具说明,让模型自主推理往往比强行规定路径更有效。
  4. 路径选择要匹配组织能力:Cursor 专家模式上限高但门槛也高;自研框架集成模式确定性高,更适合 B 端产品落地。

AI 产品的探索之路仍在继续,但我们已经找到了从"策略架构"到"自主推理"的清晰路径。

AI编程RAGAgentMCP