思维链提示过程

思维链提示(CoT)是一种最近开发的提示方法,它鼓励大型语言模型解释其推理过程。下图比较了常规的few-shot标准提示(左)和链式思维提示过程(右)。

1.png

常规提示过程 vs 思维链提示过程(Wei et al.)

思维链提示过程的核心思想是向大型语言模型展示少量示例,并在这些示例中解释推理过程,从而在模型回答提示时呈现推理过程。这种推理过程的解释通常能够引导出更准确的结果。

结论

研究表明,思维链提示过程在算术、常识和符号推理等任务中能够改善结果。尤其是在GSM8K基准测试中,使用PaLM 540B模型的提示方法达到了57%的准确率。

2.png

Comparison of models on the GSM8K benchmark (Wei et al.)

限制

重要的是,根据Wei等人的说法,“思维链仅在使用∼100B参数的模型时才会产生性能提升”。较小的模型编写了不合逻辑的思维链会导致精度比标准提示更差。通常,模型从思维链提示过程中获得性能提升的方式与模型的大小成比例。

标签: prompt教程, prompt基础, prompt进阶, prompt应用, prompt核心, prompt提示, 提示工程, 提示工程师, prompt提示工程, prompt基础教程, prompt进阶教程, prompt高级教程, prompt核心教程, prompt代码教程, prompt菜鸟教程, prompt命令教程, prompt使用教程