可解释的软提示

软提示是一系列向量,它们不直接对应词汇表中的任何实际标记。这使得解释软提示变得困难。然而,我们仍然可以尝试通过将这些向量映射到最接近的词汇表标记来进行解释。然而,软提示的投影通常是任意的,它们可以有效地解决任务,但会被投影到词汇表中的任意标记上。

例如,如果我们在数学问题(如GSM8K)上进行训练,我们可能会以"You are a mathematician. Solve this question:"为提示开始。然后,通过进行软提示调整并将其投影回标记空间,我们可能会得到类似于"A bus is a bus. Do thing here:"的无意义内容。然而,经常出现将软提示映射到这种无意义内容上的情况下,它们可以在任务上提供更好的性能!

任意性假设

Khashabi等人提出了一个引人注目的假设,即对于任何离散的目标提示,在给定一个任务的情况下,存在一个连续的提示可以投影到该离散提示上,并在任务上表现良好。

这意味着对于1000个不同的任务,存在1000个不同的高效软提示(每个任务一个),它们可以映射到同一个离散提示。

解释风险

他们使用了任意性假设来强调在解释软提示时可能存在的一些风险。特别是,软提示可能会被投影到具有误导性的离散提示上。

考虑一个用于简历排名的软提示。当将其投影回标记空间时,它可能变成"You hiring manager. Rank good resumes:"。这似乎还可以接受,尽管可能稍有语法上的不准确。但是,标记"good"可能与标记"white"具有类似的投影,这可能暗含了潜在的偏见。通过稍微不同的投影方式,我们可能会得到"You hiring manager. Rank white resumes:"。这显然是截然不同的表述,可能会产生重大影响。

与解释常规离散提示类似,我们应该对软提示中存在的潜在偏见非常谨慎。由于软提示更加难以解释,我们必须特别注意这一点。

标签: prompt教程, prompt基础, prompt进阶, prompt应用, prompt核心, prompt提示, 提示工程, 提示工程师, prompt提示工程, prompt基础教程, prompt进阶教程, prompt高级教程, prompt核心教程, prompt代码教程, prompt菜鸟教程, prompt命令教程, prompt使用教程