Prompt教程-词汇参考

词汇参考
请参考本课程中我们将使用的术语和概念的列表。
大型语言模型(LLMs)、预训练语言模型(PLMs)、语言模型(LMs)和基础模型
这些术语在很大程度上指的是相同的东西:大型人工智能(神经网络),通常在大量文本上进行了训练。
掩蔽语言模型(MLMs)
MLMs是一种自然语言处理模型,它具有特殊的标记,通常为[MASK]
,该标记将被词汇表中的一个词替换。然后,模型会预测被掩蔽的词。例如,如果句子是"The dog is [MASK] the cat",模型将以很高的概率预测为"chasing"。
标签
标签的概念通过一个例子来理解最好。
假设我们要将一些推文分类为恶意或非恶意。如果我们有一列推文及其对应的标签(恶意或非恶意),我们可以训练一个模型来分类推文是否恶意。标签通常只是分类任务的可能性。
标签空间
给定任务的所有可能标签(在上面的例子中为'mean'和'not mean')。
情感分析
情感分析是将文本分类为积极、消极或其他情感的任务。
"模型" vs. "AI" vs. "LLM"
这些术语在本课程中有时可以互换使用,但它们并不总是指相同的事物。正如上面所提到的,LLMs是一种AI类型,但并非所有AI都是LLMs。在本课程中提到的模型是指AI模型。因此,在本课程中,您可以将术语"模型"和"AI"视为可互换使用。
机器学习(ML)
机器学习是一门研究能够从数据中学习的算法的学科。机器学习是人工智能的一个子领域。
口头化
在分类设置中,口头化是将标签映射到语言模型词汇表中的单词的过程。例如,考虑使用以下提示进行情感分类:
推文:"我喜欢热口袋"
这条推文的情感是什么?回答'pos'或'neg'。
在这里,口头化是将概念标签“positive”和“negative”映射到令牌“pos”和“neg”的过程。
通过人类反馈进行强化学习(RLHF)
RLHF是一种根据人类偏好数据