Prompt教程-思维链提示过程

作者: 网管

时间: 2023-05-16

思维链提示过程

思维链提示（CoT）是一种最近开发的提示方法，它鼓励大型语言模型解释其推理过程。下图比较了常规的few-shot标准提示（左）和链式思维提示过程（右）。

常规提示过程 vs 思维链提示过程(Wei et al.)

思维链提示过程的核心思想是向大型语言模型展示少量示例，并在这些示例中解释推理过程，从而在模型回答提示时呈现推理过程。这种推理过程的解释通常能够引导出更准确的结果。

研究表明，思维链提示过程在算术、常识和符号推理等任务中能够改善结果。尤其是在GSM8K基准测试中，使用PaLM 540B模型的提示方法达到了57%的准确率。

Comparison of models on the GSM8K benchmark (Wei et al.)

重要的是，根据Wei等人的说法，“思维链仅在使用∼100B参数的模型时才会产生性能提升”。较小的模型编写了不合逻辑的思维链会导致精度比标准提示更差。通常，模型从思维链提示过程中获得性能提升的方式与模型的大小成比例。