具有推理和行动能力的LLMs

ReAct(Reason, Act)是一个示例语言模型范例,旨在使用自然语言推理来解决复杂任务。它被设计用于允许LLM执行特定操作的任务。在MRKL系统中,LLM可以与外部API进行交互以检索信息。当面临问题时,LLM可以选择执行操作来检索信息,并根据检索到的信息回答问题。

ReAct系统可以被看作是具有推理和行动能力的MRKL系统。

根据您提供的描述,下图显示了一个示例,顶部的框中的问题来自HotPotQA,这是一个需要进行复杂推理的问答数据集。ReAct能够首先通过推理问题(Thought 1),然后执行一个动作(Act 1),向Google发送查询来回答问题。然后它接收到一个观察(Obs 1),并继续进行思考、行动和观察的循环,直到得出结论(Act 3)。

1.png

ReAct System (Yao et al.)

具有强化学习知识的读者可能会认为,这个过程类似于经典的RL循环:状态,行动,奖励,状态,...。ReAct在其论文中对此进行了一些规范化。

结论

谷歌在ReAct的实验中使用了PaLMLLM。与标准提示(仅问题)、CoT和其他配置进行比较表明,ReAct在复杂推理任务方面的表现是有希望的。谷歌还对涵盖事实提取和验证的Fever数据集进行了研究。

2.png

标签: prompt教程, prompt基础, prompt进阶, prompt应用, prompt核心, prompt提示, 提示工程, 提示工程师, prompt提示工程, prompt基础教程, prompt进阶教程, prompt高级教程, prompt核心教程, prompt代码教程, prompt菜鸟教程, prompt命令教程, prompt使用教程