Prompt教程-思维链提示过程

思维链提示过程
思维链提示(CoT)是一种最近开发的提示方法,它鼓励大型语言模型解释其推理过程。下图比较了常规的few-shot标准提示(左)和链式思维提示过程(右)。
常规提示过程 vs 思维链提示过程(Wei et al.)
思维链提示过程的核心思想是向大型语言模型展示少量示例,并在这些示例中解释推理过程,从而在模型回答提示时呈现推理过程。这种推理过程的解释通常能够引导出更准确的结果。
结论
研究表明,思维链提示过程在算术、常识和符号推理等任务中能够改善结果。尤其是在GSM8K基准测试中,使用PaLM 540B模型的提示方法达到了57%的准确率。
Comparison of models on the GSM8K benchmark (Wei et al.)
限制
重要的是,根据Wei等人的说法,“思维链仅在使用∼100B参数的模型时才会产生性能提升”。较小的模型编写了不合逻辑的思维链会导致精度比标准提示更差。通常,模型从思维链提示过程中获得性能提升的方式与模型的大小成比例。