【大模型专题】之三十一：Fine-tuning模型微调基础知识

云烟 • 12小时前 • 编程

欢迎大家来到IT世界,在知识的湖畔探索吧!

欢迎您访问【曹小曹】头条号，很高兴能够与您分享有价值的信息和观点。衷心希望您能在我的头条号上找到您感兴趣的内容，并在评论区留下您的宝贵意见和反馈。

大模型微调（Fine-tuning）是指在已经预训练好的大语言模型基础上，使用特定的数据集进行进一步的训练，使模型适应特定任务或领域。例如，一个通用大模型涵盖了许多语言信息，并能够进行流畅的对话。但如果涉及到某个专业领域，例如在医药方面能够很好地回答患者的问题，就需要为这个通用大模型提供更多新的优质数据供其学习和理解。为了确定模型能够正确回答，我们就需要对基础模型进行微调。

为什么需要微调

1、Prompt Engineering的方式是一种相对来说容易上手的使用大模型的方式，但是它的缺点也非常明显。因为通常大模型的实现原理，都会对输入序列的长度有限制，Prompt Engineering 的方式会把Prompt搞得很长。越长的Prompt，大模型的推理成本越高，因为推理成本是跟Prompt长度的平方正向相关的。另外，Prompt太长会因超过限制而被截断，进而导致大模型的输出质量不高。对于个人使用者而言，如果是解决自己日常生活、工作中的一些问题，直接用Prompt Engineering的方式，通常问题不大。但对于对外提供服务的企业来说，要想在自己的服务中接入大模型的能力，推理成本是不得不要考虑的一个因素，微调相对来说就是一个更优的方案。

2、大模型的参数量非常大，训练成本非常高，每次都去从头训练一个自己的大模型，这个事情的性价比非常低；

3、Prompt Engineering的效果达不到要求，企业又有比较好的自有数据，能够通过自有数据，更好的提升大模型在特定领域的能力。这时候微调就非常适用。

4、要在个性化的服务中使用大模型的能力，这时候针对每个用户的数据，训练一个轻量级的微调模型，就是一个不错的方案。

5、数据安全的问题。如果数据是不能传递给第三方大模型服务的，那么搭建自己的大模型就非常必要。通常这些开源的大模型都是需要用自有数据进行微调，才能够满足业务的需求，这时候也需要对大模型进行微调。

微调主要方法

根据微调对整个预训练模型的调整程度，微调可以分为全微调和部分微调两个方法：

部分微调（Repurposing）：部分微调是指在微调过程中只更新模型的顶层或少数几层，而保持预训练模型的底层参数不变。部分微调通常适用于目标任务与预训练模型之间有一定相似性，或任务数据集较小的情况。部分微调需要较少的计算资源和时间，但在某些情况下性能可能会有所降低。

全微调（Full Fine-tuning）：全微调是指对整个预训练模型进行微调，包括所有模型参数。这种微调方法通常适用于任务和预训练模型之间存在较大差异，或任务需要模型具有高度灵活性和自适应能力的情况。全微调需要较多计算资源和时间，但可以获得更好的性能。

选择全微调还是部分微调取决于任务特点和可用资源。在实际应用中，可以根据任务需求和实验结果来选择适当的微调方法。

微调类型

根据微调使用的数据集类型，大模型微调还可以分为监督微调和无监督微调两种：

监督微调（Supervised Fine-tuning）：监督微调是指在进行微调时使用有标签的训练数据集。这些标签提供了模型在微调过程中的目标输出。通过使用标签来指导模型微调，可以使模型更好地适应特定任务。

无监督微调（Unsupervised Fine-tuning）：无监督微调是指在进行微调时使用无标签的训练数据集。这意味着在微调过程中，模型只能利用输入数据本身的信息，而没有明确的目标输出。这种方法通过学习数据的内在结构或生成数据来进行微调，以提取有用特征或改进模型的泛化能力。

监督微调和无监督微调这两种微调方法可以单独使用，也可以结合使用，具体取决于任务类型和可用数据的质量和规模。

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://itzsg.com/113064.html