这篇论文提供了关于生成人工智能系统中提示工程技术的全面调查报告,旨在建立对提示工程的结构化理解,提供了 33 个术语的详细词汇表、58 种大型语言模型提示技术的分类法以及其他模态的 40 种技术,并给出了提示工程的最佳实践和指导方针。
论文标题: The Prompt Report: A Systematic Survey of Prompt Engineering Techniques(中文可译为《提示报告:一种系统化的提示工程技术综述》)
arXiv 编号: 2406.06608,首次提交于 2024 年 6 月 6 日,最新修订版(v6)在 2025 年 2 月 26 日发布
核心内容概览
这篇文章集中讨论了“提示工程(Prompt Engineering)”这一领域,通过系统性文献调查,清晰地整理了该领域中的术语、技术、方法与实践。
1. 术语与技术分类
- 建立了33 个相关术语的词汇表,帮助明确提示工程中常用的概念
2. 技术体系与清单
- 提出了58 种针对文本(text-only)的提示技术;
- 另外还整理了40 种多模态(如图像、音频、视频等)的提示技术
3. 方法与策略
- 包含“提示元分析”(meta-analysis),系统评估自然语言前缀提示(prefix-prompting)相关文献。
- 分析了多种文本提示策略,比如:
- In-Context Learning(ICL)
- Zero-Shot
- Thought Generation
- Decomposition
- Ensembling
- Self-Criticism 等
4. 拓展领域
- 不局限于英文文本,还覆盖多语种提示、提示模板语言选择、机器翻译、图像/音频/视频/3D 多模态提示等
- 探讨高阶应用方向,如:工具使用 Agent、代码生成 Agent、RAG(Retrieval Augmented Generation) 等内容
5. 实用指南与安全评估
- 提供提示工程中的最佳实践与指导建议,特别适合用于当下主流模型(例如 ChatGPT)
- 提出评估提示技术的方法,并讨论安全性问题(如提示攻击风险)
6. 总结与定位
- 作者团队来自 OpenAI、Stanford、Microsoft 等多个顶级研究机构,文章被认为是迄今为止最全面、最系统的提示工程综述
总结(简明版)
这篇论文通过系统文献回顾,创建了完整的提示工程术语体系与技术分类,涵盖文本与多模态提示的方法,并结合实际应用需求提供操作建议与安全考量,可视为该领域的“纲领性资源”。
可能感兴趣的方向
- 详细拆解某几类提示技术(如 Self-Criticism、Ensembling 等)的定义与应用?
- 对比文本提示与多模态提示的异同及应用场景?
- 总结提示工程的最佳实践与常见陷阱?
- 探讨提示技术在 multilingual 或者 tool-use agent 模型中的潜力与挑战?