Appearance
记录 LLM、RAG、Agent、评测与生产化部署中真正影响效果和稳定性的技术细节。
关注服务架构、上线流程、成本控制和可观测性,而不只停留在 Demo。
拆解提示词、工具调用、上下文管理和评测方法,帮助系统稳定迭代。
覆盖向量检索、RAG、知识库维护和内容质量治理。
从工具调用、状态管理到失败恢复,梳理 Agent 从概念走向服务的关键设计。
检索质量、切片策略、重排、缓存和观测指标,是 RAG 长期可用的基础。
把提示词当作可版本化、可测试、可回滚的工程资产来管理。
从人工验收到自动评测,建立能支持上线决策的评估闭环。