RAFT 方法微调 RAG 模型

论文： RAFT: Adapting Language Model to Domain Specific RAG, 2024
链接： https://arxiv.org/pdf/2403.10131

核心思想：如何最好地准备考试？

相比之下，我们的方法RAFT利用了微调与问答对，并在一个模拟的不完美检索环境中参考文档——从而有效地为开卷考试环境做准备。

让LLMs从一组正面和干扰文档中读取解决方案，这与标准的RAG设置形成对比，因为在标准的RAG设置中，模型是基于检索器输出进行训练的，这包含了记忆和阅读的混合体。

在测试时，所有方法都遵循标准的RAG设置，即提供上下文中排名前k的检索文档。

RAFT在所有专业领域的RAG性能上有所提升，涵盖以下多个领域：

适应特定领域的挑战：

技术融合创新：

抗干扰能力提升：

训练示例代码：https://github.com/lumpenspace/raft

RAFT方法为RAG系统在特定领域的应用提供了新的优化思路，通过模拟不完美检索环境的训练方式，显著提升了模型在实际应用场景中的表现。