我的AI产品探索之旅

我的AI产品探索之旅
引言
从2024年基于RAG的智能客服系统,到2025年Q3的Agent智能体探索,再到Q4强推理模型下的范式转移,这是一段关于AI产品从"策略架构"到"自主推理"的完整演进路径。本文将分享这三个阶段的核心实践、遇到的挑战以及最终找到的解决方案。
阶段一:基于 RAG 的智能客服&AI润色文案(2024)
在这个阶段,你的角色更像是 "AI 策略架构师"。你不是在写代码,而是在设计一套信息过滤与调教的机制。
1. 知识库建设:从"堆料"到"精炼"
知识库的质量决定了 AI 表现的上限(Garbage in, Garbage out)。
格式转换: 将 PDF、Word、HTML 统一转化为 Markdown,去除冗余的页眉页脚和乱码。
Chunking 策略: 不是简单的按字数切分,而是基于语义段落(Heading-based)切分,确保每个分块(Chunk)逻辑完整。
2. 提示词工程(Prompt Engineering):建立边界
客服场景下,AI 的稳定性和合规性远比创造力重要。
角色设定 (Role): "你是一个专业且有温度的 [品牌名] 客服专家。"
任务约束 (Constraints):
- "仅使用检索到的 Context 回答,严禁幻觉。"
- "如果知识库中没有答案,请引导用户联系人工客服。"
输出格式 (Format): 要求使用 Markdown 列表提高可读性。
少样本引导 (Few-shot): 提供 2-3 对标准"Q&A"范例,让 AI 模仿语气和逻辑。
场景介绍
1. 效能分析摘要(Efficiency Analytics)
输入: 原始的研发工时、任务状态、代码提交量、Bug 修复率等数据。
AI 的处理逻辑:
- 异常识别: 识别数据中的"离群值"(例如:某个 Sprint 的 Bug 解决时间异常长)。
- 归因建议: 不只是说"进度慢了",而是通过关联任务描述,总结出"慢"的原因(如:需求变更频繁或技术债务过多)。
- 行动项生成: 将枯燥的仪表盘数据转化为 3 条可执行的改进建议。
2. 月报总结提炼(Monthly Reports)
挑战: 月报内容通常碎片化、流水账,缺乏逻辑深度。
AI 的处理逻辑:
- 由点及面: 将 20 条零散的工作记录,按照"业务增长"、"系统稳定性"、"团队建设"等维度进行聚类。
- 风格对齐: 将不同成员口语化的描述,统一润色为符合公司文化的专业书面语(例如:从"修了好多 Bug"优化为"系统可用性提升了 15%,解决了 3 个核心链路的顽固故障")。
第二阶段:2025 年Q3 —— Agent 智能体的"深水区探索"
随着行业内 Agent 框架成熟和 MCP 协议的出现,你开始在"研发效能驾驶舱"中搭建具备自主推理能力的智能分析 Agent。
1. MCP 架构的引入与初步尝试
工程实现: 将原有的 API 接口封装为 MCP 工具,让模型可以直接触达实时数据库(Git、Jira 等)。
早期结果:
- 单步骤查询(如:查某个指标)逻辑通顺。
- 复杂下钻场景失效:模型在处理长链条推理时经常"吞掉"中间的工具执行步骤。
2. "百个工具"危机与治理重构
遇到的痛点:
- 工具过载: 当指标下钻工具超过 100 个时,模型频繁调错工具。
- 上下文崩溃: 100 个工具的描述占满了模型的 Context Window(在 Cursor 中频发告警)。
重构策略(治理三板斧):
- 工具分组: 增加命名空间前缀(如 quality_)。
- 场景合并: 弃用原子化 API,将相关指标合并为"通用场景工具",由模型通过传参来选择维度。
- 精细化设计: 重新定义工具的 Name、Description、Input(极简)和 Output(提纯)。
第三阶段:2025 年 Q4 —— 强推理模型下的"范式转移"
你迎来了技术架构的成熟期,通过模型升级与设计哲学的反思,找到了 Agent 落地的最优解。
1. 核心决策:Claude 3.7 + 弱提示词策略
基座升级: 从依赖 SOP 的 GPT-4o mini 升级为具备强大思维链(Thinking Process)的 Claude 3.7。
设计哲学转变:
- 弱化系统提示词: 仅保留工具规则,不再强行规定分析的 SOP 路径。
- 强化工具说明: 依靠模型自身的推理能力去自发组合工具。
关键发现: 过于复杂的 System Prompt 会压制模型灵活性,减弱用户的自主探索体验。
2. 二元路径的深度思考
路径 A:Cursor 专家模式(上限极高)
- 利用细粒度工具和 Slash Command 自动化复杂任务。
- 认知: 强工程能力 + 强模型可以实现"全能 Agent",但对使用者的素质(Prompt 架构能力)要求极高。
路径 B:自研框架集成模式(确定性高)
- 针对公司基建较弱的现实,通过"固定场景工具"和"产品流程深度融合"来保证稳定性。
- 认知: 不必追求全能,将 Agent 嵌入现有流程(Trigger-based)是 B 端产品落地的更佳路径。
结论:从策略架构到自主推理的演进
回顾这三个阶段的探索,你会发现 AI 产品的落地并非一蹴而就。从 RAG 时代的知识库精炼与提示词边界设定,到 Agent 时代的工具治理与架构重构,再到强推理模型下的设计哲学转变,每一步都需要在"能力上限"与"落地确定性"之间找到平衡。
核心启示:
- 知识库质量决定上限:无论技术如何演进,数据质量始终是基础。
- 工具治理是规模化前提:当工具数量超过临界点,必须通过分组、合并、精细化设计来维持可控性。
- 设计哲学需要匹配模型能力:强推理模型下,弱化 SOP、强化工具说明,让模型自主推理往往比强行规定路径更有效。
- 路径选择要匹配组织能力:Cursor 专家模式上限高但门槛也高;自研框架集成模式确定性高,更适合 B 端产品落地。
AI 产品的探索之路仍在继续,但我们已经找到了从"策略架构"到"自主推理"的清晰路径。