Skip to content

提示词工程的可维护实践

提示词不是一次性文本,而是应用逻辑的一部分。只要它影响线上结果,就应该被版本化、评测和审查。

结构化管理

把提示词拆成角色、任务、约束、输入格式、输出格式和示例。这样做可以降低修改风险,也方便定位是哪一段指令导致行为变化。

text
角色:你是企业知识库问答助手。
任务:基于给定资料回答用户问题。
约束:不能编造资料中不存在的信息。
输出:先给结论,再列出依据来源。

版本与回滚

每次改动提示词都应该留下版本号、改动原因和评测结果。线上出现异常时,可以快速回滚到上一个稳定版本。

测试样例

提示词测试不需要一开始就很复杂。可以先维护三类样例:

  • 高频正常问题。
  • 边界问题,例如资料缺失、表达含糊、权限不足。
  • 历史失败问题。

输出约束

当应用需要稳定消费模型结果时,优先使用 JSON schema 或结构化输出能力,而不是只在自然语言里描述“请输出 JSON”。

小结

好的提示词工程不是堆更多指令,而是让提示词变得可读、可测、可追踪。工程体系越完整,模型升级和业务变化时越不容易失控。

专注可落地的 AI 工程实践