RAG系统核心难点与模型微调实战指南

🎯 一、项目实施的5大难点

难点1：检索不准确（最常见！）

表现：

学生问："为什么植物晚上不进行光合作用？"
系统检索到：
- ❌ 文档1：关于植物根系的内容（相似度0.72）
- ❌ 文档2：关于植物营养的内容（相似度0.69）
- ✅ 文档3：关于光合作用条件的内容（相似度0.65）← 分数最低反而最相关！

结果：答非所问

根本原因：

向量相似度≠语义相关度
分块策略不合理（切断了上下文）
Embedding模型对教育领域不敏感
缺少元数据辅助（章节、关键词）

解决方案（按难度排序）：

方案A：优化分块策略（最简单，效果显著）⭐⭐⭐⭐⭐

# 问题：固定长度分块破坏语义
# 错误示例
chunk_1 = "光合作用是植物利用光能，将二氧化碳和水转化为有机物，并释放"
chunk_2 = "氧气的过程。这个过程需要三个条件：光照、叶绿素和原料..."
# ❌ "释放"和"氧气"被切断，语义不完整

# 正确做法：语义分块
from langchain.text_splitter import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=500,
    chunk_overlap=100,  # 重要！保留上下文
    separators=[
        "\n\n",    # 优先按段落分
        "\n",      # 其次按行分
        "。",      # 再按句子分
        "！",
        "？",
        "；",
        "，",
        " ",
        ""
    ],
    length_function=len,
)

# 还要考虑章节结构
def smart_chunking(text, metadata):
    """智能分块：保持章节完整性"""
    chunks = []
    
    # 1. 按章节分割
    sections = re.split(r'第[一二三四五六七八九十\d]+[章节课]', text)
    
    for section in sections:
        # 2. 每个章节内再细分
        sub_chunks = text_splitter.split_text(section)
        
        for i, chunk in enumerate(sub_chunks):
            chunks.append({
                "content": chunk,
                "metadata": {
                    **metadata,
                    "chunk_index": i,
                    "section": extract_section_title(section)
                }
            })
    
    return chunks

方案B：增强元数据（中等难度，效果好）⭐⭐⭐⭐

# 为每个文本块添加丰富的元数据
def enrich_metadata(chunk, pdf_page):
    """提取并增强元数据"""
    
    metadata = {
        # 基础信息
        "book": "初中生物九年级上册",
        "chapter": extract_chapter(chunk),  # 第3章
        "section": extract_section(chunk),  # 第2节
        "page": pdf_page,
        
        # 关键信息提取
        "keywords": extract_keywords(chunk),  # ["光合作用", "叶绿素", "光能"]
        "concepts": extract_concepts(chunk),  # ["光合作用"]
        "formulas": extract_formulas(chunk), # ["6CO2+6H2O→C6H12O6+6O2"]
        
        # 类型标注
        "content_type": classify_content(chunk),  # "定义" / "过程" / "实验"
        "difficulty": assess_difficulty(chunk),   # "基础" / "进阶" / "拓展"
        
        # 关联信息
        "related_sections": [],  # 相关章节
        "prerequisites": [],     # 前置知识
    }
    
    return metadata

# 使用元数据过滤检索
def retrieval_with_filters(question, filters=None):
    """带过滤的检索"""
    
    # 从问题中提取意图
    if "是什么" in question or "定义" in question:
        filters = {"content_type": "定义"}
    elif "过程" in question or "步骤" in question:
        filters = {"content_type": "过程"}
    
    # 检索时应用过滤
    results = vectorstore.similarity_search(
        question,
        k=5,
        filter=filters  # 只检索特定类型的内容
    )
    
    return results

方案C：混合检索（中高难度）⭐⭐⭐⭐

from langchain.retrievers import EnsembleRetriever
from langchain.retrievers import BM25Retriever

def hybrid_retrieval(question):
    """混合检索：向量检索 + 关键词检索"""
    
    # 1. 向量检索（语义相似）
    vector_results = vectorstore.similarity_search(question, k=5)
    
    # 2. BM25关键词检索（精确匹配）
    bm25_retriever = BM25Retriever.from_documents(all_documents)
    keyword_results = bm25_retriever.get_relevant_documents(question, k=5)
    
    # 3. 融合结果（RRF算法）
    ensemble_retriever = EnsembleRetriever(
        retrievers=[vector_retriever, bm25_retriever],
        weights=[0.6, 0.4]  # 向量60%，关键词40%
    )
    
    final_results = ensemble_retriever.get_relevant_documents(question)
    
    return final_results

难点2：答案质量不稳定

表现：

相同问题问3次，得到3个不同的答案：
第1次："光合作用是植物利用光能..."（正确，来自课本）
第2次："光合作用就像太阳能充电..."（比喻过多，偏离课本）
第3次："简单来说，就是植物吃饭..."（太口语化，不专业）

原因：

LLM的随机性（temperature过高）
Prompt不够明确
缺少示例和约束
没有答案验证机制

解决方案：

方案A：Prompt工程（立即见效）⭐⭐⭐⭐⭐

# 问题Prompt（模糊）
prompt = f"""
根据以下内容回答问题：
{context}

问题：{question}
"""

# 优化后的Prompt（明确约束）
prompt = f"""
# 角色和任务
你是初中生物教师，任务是基于课本内容准确回答学生问题。

# 参考课本内容
{context}

# 学生问题
{question}

# 回答要求（必须严格遵守）
1. 【准确性】必须基于上述课本内容，不得添加课本没有的内容
2. 【完整性】如果是定义类问题，必须给出完整定义
3. 【语言】使用课本的表述，不要过度简化或口语化
4. 【举例】仅在课本有例子时才举例，不要自己编例子
5. 【来源】在答案末尾注明来源（章节和页码）

# 回答格式（必须遵循）
[直接给出答案，不要说"根据课本"这样的开头]

[如果课本中有，可以补充一句解释]

来源：第X章第X节，第X页

# 禁止事项
- ❌ 不要说"我认为"、"我觉得"
- ❌ 不要编造课本没有的内容
- ❌ 不要使用过度口语化的表达
- ❌ 不要添加个人观点

现在请回答：
"""

# 还可以添加Few-Shot示例
prompt_with_examples = prompt + """
# 示例1（正确）
问题：什么是光合作用？
回答：光合作用是绿色植物通过叶绿体，利用光能，把二氧化碳和水转化成储存能量的有机物，并释放出氧气的过程。
来源：第3章第2节，第45页

# 示例2（错误，不要模仿）
问题：什么是光合作用？
回答：我觉得光合作用就像植物在吃饭，太阳就是它的食物...
[这样的回答太口语化，且偏离课本表述]

现在轮到你了：
"""

方案B：降低Temperature（简单有效）⭐⭐⭐⭐

# Temperature控制随机性
# 0 = 完全确定（每次回答相同）
# 1 = 高随机性（每次回答不同）

# 教育场景推荐配置
llm_config = {
    "temperature": 0.3,      # 低温度，保证稳定性
    "top_p": 0.9,           # 核采样
    "frequency_penalty": 0.2, # 减少重复
    "presence_penalty": 0.1,  # 鼓励新内容
    "max_tokens": 2000,      # 限制长度
}

方案C：答案验证机制（高级）⭐⭐⭐⭐

def validate_answer(question, answer, context):
    """验证答案质量"""
    
    checks = {
        "has_source": False,      # 是否标注来源
        "based_on_context": False, # 是否基于检索内容
        "complete": False,         # 是否完整
        "appropriate_length": False, # 长度是否合适
    }
    
    # 检查1：是否有来源标注
    if "来源" in answer or "第" in answer and "页" in answer:
        checks["has_source"] = True
    
    # 检查2：答案是否基于context
    # 简单方法：检查重要词是否在context中
    answer_keywords = extract_keywords(answer)
    context_keywords = extract_keywords(context)
    overlap = len(set(answer_keywords) & set(context_keywords))
    if overlap > len(answer_keywords) * 0.5:  # 50%以上的词在context中
        checks["based_on_context"] = True
    
    # 检查3：长度是否合理
    if 50 < len(answer) < 1000:
        checks["appropriate_length"] = True
    
    # 检查4：是否完整（针对定义类问题）
    if "是什么" in question or "定义" in question:
        # 定义应该包含主语
        subject = extract_subject(question)  # "光合作用"
        if subject in answer[:100]:  # 前100字包含主语
            checks["complete"] = True
    else:
        checks["complete"] = True
    
    # 综合评分
    score = sum(checks.values()) / len(checks)
    
    # 如果评分过低，重新生成
    if score < 0.75:
        return False, "答案质量不佳，需要重新生成", checks
    
    return True, "答案通过验证", checks

# 使用示例
answer = generate_answer(question, context)
is_valid, message, details = validate_answer(question, answer, context)

if not is_valid:
    # 重新生成，使用更严格的Prompt
    answer = regenerate_with_stricter_prompt(question, context)

难点3：公式和特殊符号处理

表现：

课本内容："6CO₂ + 6H₂O → C₆H₁₂O₆ + 6O₂"
向量化后：乱码或丢失下标
检索时：匹配不到正确内容

解决方案：

def process_formulas(text):
    """处理公式和特殊符号"""
    
    # 1. 识别公式
    formula_pattern = r'[A-Z][a-z]?[\d₀₁₂₃₄₅₆₇₈₉]*[\+\-→=].*'
    formulas = re.findall(formula_pattern, text)
    
    processed_chunks = []
    
    for formula in formulas:
        # 2. 保留原始公式
        original = formula
        
        # 3. 转换为文字描述（用于向量化）
        description = formula_to_text(formula)
        # "6CO₂ + 6H₂O → C₆H₁₂O₆ + 6O₂"
        # → "六分子二氧化碳加六分子水生成一分子葡萄糖和六分子氧气"
        
        # 4. 同时存储两个版本
        processed_chunks.append({
            "content": text.replace(formula, f"{formula} ({description})"),
            "metadata": {
                "formulas": [original],
                "formula_descriptions": [description]
            }
        })
    
    return processed_chunks

def formula_to_text(formula):
    """公式转文字"""
    mapping = {
        "CO₂": "二氧化碳",
        "H₂O": "水",
        "C₆H₁₂O₆": "葡萄糖",
        "O₂": "氧气",
        "→": "生成",
        "+": "加"
    }
    
    result = formula
    for symbol, text in mapping.items():
        result = result.replace(symbol, text)
    
    return result

难点4：图表内容缺失

问题：
课本中30%的信息在图表中，纯文本PDF无法提取。

解决方案：

方案A：人工标注（最准确）⭐⭐⭐⭐⭐

# 为每张图表手动添加描述
image_descriptions = {
    "chapter3_fig1.png": {
        "title": "图3-1 光合作用示意图",
        "description": """
        该图展示了光合作用的过程：
        1. 左侧箭头表示光能射入叶片
        2. 中间的叶绿体是光合作用的场所
        3. 箭头显示二氧化碳和水进入叶绿体
        4. 右侧箭头显示产生的葡萄糖和氧气
        5. 整个过程需要光照和叶绿素
        """,
        "keywords": ["光合作用", "叶绿体", "光能", "二氧化碳", "氧气"],
        "related_text": "第45-46页"
    }
}

# 插入到对应的文本块中
def enrich_with_images(text_chunk, page_num):
    images = find_images_in_page(page_num)
    for img in images:
        if img in image_descriptions:
            text_chunk += "\n\n" + image_descriptions[img]["description"]
    return text_chunk

方案B：多模态模型自动生成（自动化）⭐⭐⭐⭐

from transformers import Qwen2VLForConditionalGeneration

# 使用多模态模型理解图片
model = Qwen2VLForConditionalGeneration.from_pretrained("Qwen/Qwen2-VL-7B")

def extract_image_description(image_path):
    """自动生成图片描述"""
    
    prompt = """
    这是一张初中生物课本插图。请详细描述：
    1. 图中展示的主要内容
    2. 标注的文字和箭头
    3. 这个图说明的生物学概念
    4. 学生需要从这个图中学到什么
    """
    
    response = model.generate(image_path, prompt)
    return response

难点5：多轮对话的上下文理解

表现：

学生：什么是光合作用？
AI：光合作用是植物利用光能...

学生：它需要什么条件？← "它"指什么？
AI：❌ 不知道"它"指什么

解决方案：

class ConversationManager:
    """对话管理器"""
    
    def __init__(self):
        self.history = []
        self.context = {}
    
    def rewrite_question(self, current_question):
        """消歧：将指代词替换为实体"""
        
        if not self.history:
            return current_question
        
        # 检测指代词
        pronouns = ["它", "他", "她", "这个", "那个", "这", "那"]
        has_pronoun = any(p in current_question for p in pronouns)
        
        if not has_pronoun:
            return current_question
        
        # 从历史中找到最近提到的主题
        last_topic = self.extract_topic(self.history[-1]["question"])
        
        # 替换指代词
        rewritten = current_question
        for pronoun in pronouns:
            if pronoun in rewritten:
                rewritten = rewritten.replace(pronoun, last_topic, 1)
        
        return rewritten
    
    def extract_topic(self, question):
        """提取问题主题"""
        # 简单方法：提取第一个名词
        import jieba.posseg as pseg
        words = pseg.cut(question)
        for word, flag in words:
            if flag.startswith('n'):  # 名词
                return word
        return ""
    
    def ask(self, question):
        """带上下文的提问"""
        
        # 1. 改写问题
        rewritten_question = self.rewrite_question(question)
        
        # 2. 检索
        docs = self.retrieve(rewritten_question)
        
        # 3. 生成答案（包含历史）
        prompt = f"""
        对话历史：
        {self.format_history()}
        
        当前问题：{question}
        
        参考内容：{docs}
        
        请基于参考内容回答当前问题。
        """
        
        answer = self.generate(prompt)
        
        # 4. 记录历史
        self.history.append({
            "question": question,
            "rewritten": rewritten_question,
            "answer": answer
        })
        
        return answer

🎓 二、模型微调完整指南

什么时候需要微调？

✅ 需要微调的情况：
1. 基础模型对教育领域词汇理解不准
2. 答案风格不符合教学要求
3. 特定术语识别错误
4. 需要遵循特定的回答格式

❌ 不需要微调的情况：
1. 只是Prompt写得不好 → 优化Prompt
2. 检索不准 → 优化检索策略
3. 数据质量差 → 清洗数据
4. 硬件资源不足 → 先用API

微调方案选择

方案	成本	效果	适用场景
Prompt优化	免费	⭐⭐⭐	90%的情况够用
Few-Shot学习	免费	⭐⭐⭐⭐	有少量示例
LoRA微调	低(GPU几小时)	⭐⭐⭐⭐	有1000+样本
全参数微调	高(数天GPU)	⭐⭐⭐⭐⭐	预算充足

方案1：Prompt优化（推荐先做）⭐⭐⭐⭐⭐

无需微调模型，调整输入即可！

# 基础Prompt（效果差）
prompt = "回答问题：{question}"

# 优化后（效果提升50%）
prompt = """
你是初中生物教师。严格基于以下课本内容回答。

课本内容：
{context}

学生问题：
{question}

要求：
1. 使用课本原文表述
2. 不要添加课本没有的内容
3. 标注来源

回答：
"""

# 高级Prompt（效果提升80%）
prompt = """
# 角色
你是有20年教学经验的初中生物教师，教学风格严谨准确。

# 参考教材
{context}

# 学生提问
{question}

# 回答规范
【定义类问题】给出完整准确的定义
【过程类问题】按步骤说明，使用序号
【原因类问题】解释原理，必要时举例
【对比类问题】列表对比，清晰明了

# 语言要求
- 使用教材的标准表述
- 避免口语化
- 专业术语要准确

# 示例（正确回答）
问：什么是光合作用？
答：光合作用是绿色植物通过叶绿体，利用光能，把二氧化碳和水转化成储存能量的有机物，并释放出氧气的过程。
来源：第3章第2节

现在请回答学生的问题：
"""

方案2：Few-Shot学习（效果显著）⭐⭐⭐⭐

提供3-5个示例，让模型学习回答模式

few_shot_examples = """
# 示例1：定义类问题
问题：什么是细胞？
参考内容：细胞是生物体结构和功能的基本单位...
正确回答：细胞是生物体结构和功能的基本单位。（来源：第1章第1节，第8页）

# 示例2：过程类问题
问题：光合作用的过程是怎样的？
参考内容：光合作用分为光反应和暗反应两个阶段...
正确回答：
光合作用分为两个阶段：
1. 光反应：在叶绿体类囊体膜上进行，光能转化为化学能...
2. 暗反应：在叶绿体基质中进行，利用光反应产物合成有机物...
（来源：第3章第2节，第46-47页）

# 示例3：对比类问题
问题：光合作用和呼吸作用有什么区别？
参考内容：【两个过程的描述】
正确回答：
| 维度 | 光合作用 | 呼吸作用 |
|------|---------|---------|
| 场所 | 叶绿体 | 线粒体 |
| 原料 | CO₂和H₂O | 葡萄糖和O₂ |
| 产物 | 葡萄糖和O₂ | CO₂和H₂O |
（来源：第3章，第45-52页）

# 错误示例（不要模仿）
问题：什么是光合作用？
❌ 错误回答：光合作用就是植物吃饭，太阳是它的食物...
（太口语化，偏离课本表述）

# 现在轮到你回答
问题：{question}
参考内容：{context}
正确回答：
"""

方案3：LoRA微调（深度定制）⭐⭐⭐⭐⭐

适合：有1000+优质问答对，想深度定制

Step 1：准备微调数据

# 数据格式：JSONL
# 每行一个训练样本

{
  "instruction": "你是初中生物教师，根据课本内容回答问题",
  "input": "参考内容：光合作用是绿色植物通过叶绿体...\\n\\n问题：什么是光合作用？",
  "output": "光合作用是绿色植物通过叶绿体，利用光能，把二氧化碳和水转化成储存能量的有机物，并释放出氧气的过程。\\n来源：第3章第2节，第45页"
}

# 准备数据脚本
import json

def prepare_training_data():
    """准备微调数据"""
    
    training_data = []
    
    # 从你的问答记录中提取
    qa_pairs = load_qa_history()  # 加载历史问答
    
    for qa in qa_pairs:
        if qa["rating"] >= 4:  # 只用高质量的
            training_data.append({
                "instruction": "你是初中生物教师，根据课本内容准确回答",
                "input": f"参考内容：{qa['context']}\\n\\n问题：{qa['question']}",
                "output": qa["answer"]
            })
    
    # 保存为JSONL
    with open("training_data.jsonl", "w", encoding="utf-8") as f:
        for item in training_data:
            f.write(json.dumps(item, ensure_ascii=False) + "\n")
    
    print(f"准备了 {len(training_data)} 条训练数据")
    
    # 数据质量要求：
    # ✅ 至少1000条
    # ✅ 覆盖不同题型
    # ✅ 答案经过人工审核
    # ✅ 格式统一

Step 2：使用LLaMA-Factory微调（最简单）

# 1. 安装LLaMA-Factory
git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -r requirements.txt

# 2. 配置微调参数 (在Web UI中)
python src/train_web.py

# 3. 在浏览器中配置：
# - 模型：Qwen2.5-7B
# - 方法：LoRA
# - 数据：上传 training_data.jsonl
# - 训练轮数：3
# - 学习率：5e-5
# - Batch size：4

# 4. 开始微调（需要GPU，约2-4小时）

Step 3：使用unsloth微调（更快）

# unsloth：比LLaMA-Factory快2倍，省50%显存

from unsloth import FastLanguageModel
import torch

# 1. 加载模型
model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = "Qwen/Qwen2.5-7B",
    max_seq_length = 2048,
    dtype = torch.float16,
    load_in_4bit = True,  # 4bit量化，节省显存
)

# 2. 配置LoRA
model = FastLanguageModel.get_peft_model(
    model,
    r = 16,  # LoRA秩
    target_modules = ["q_proj", "k_proj", "v_proj", "o_proj",
                      "gate_proj", "up_proj", "down_proj"],
    lora_alpha = 16,
    lora_dropout = 0.05,
    bias = "none",
    use_gradient_checkpointing = True,
)

# 3. 加载数据
from datasets import load_dataset

dataset = load_dataset("json", data_files="training_data.jsonl", split="train")

# 4. 训练
from transformers import TrainingArguments
from trl import SFTTrainer

trainer = SFTTrainer(
    model = model,
    tokenizer = tokenizer,
    train_dataset = dataset,
    dataset_text_field = "text",
    max_seq_length = 2048,
    dataset_num_proc = 2,
    args = TrainingArguments(
        per_device_train_batch_size = 2,
        gradient_accumulation_steps = 4,
        warmup_steps = 10,
        num_train_epochs = 3,
        learning_rate = 2e-4,
        fp16 = True,
        logging_steps = 10,
        output_dir = "outputs",
        optim = "adamw_8bit",
    ),
)

trainer.train()

# 5. 保存模型
model.save_pretrained("biology-teacher-lora")
tokenizer.save_pretrained("biology-teacher-lora")

Step 4：部署微调后的模型

# 方法1：在Ollama中使用

# 创建Modelfile
cat > Modelfile << EOF
FROM qwen2.5:7b

# 加载LoRA适配器
ADAPTER ./biology-teacher-lora

# 设置系统提示
SYSTEM """
你是初中生物教师，基于课本内容准确回答问题。
"""

# 设置参数
PARAMETER temperature 0.3
PARAMETER top_p 0.9
EOF

# 创建新模型
ollama create biology-teacher -f Modelfile

# 使用
ollama run biology-teacher "什么是光合作用？"

# 方法2：在Python中直接使用

from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import PeftModel

# 加载基础模型
base_model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen2.5-7B")

# 加载LoRA适配器
model = PeftModel.from_pretrained(base_model, "biology-teacher-lora")

# 推理
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen2.5-7B")

def ask(question, context):
    prompt = f"参考内容：{context}\\n\\n问题：{question}\\n\\n回答："
    inputs = tokenizer(prompt, return_tensors="pt")
    outputs = model.generate(**inputs, max_length=500)
    answer = tokenizer.decode(outputs[0], skip_special_tokens=True)
    return answer

微调效果评估

# 评估脚本

def evaluate_model(model, test_data):
    """评估微调效果"""
    
    metrics = {
        "accuracy": 0,      # 准确性
        "completeness": 0,  # 完整性
        "consistency": 0,   # 一致性
        "source_citation": 0 # 来源标注
    }
    
    for item in test_data:
        question = item["question"]
        context = item["context"]
        expected = item["expected_answer"]
        
        # 生成答案
        answer = model.generate(question, context)
        
        # 评分
        metrics["accuracy"] += score_accuracy(answer, expected)
        metrics["completeness"] += score_completeness(answer, expected)
        metrics["consistency"] += has_consistent_format(answer)
        metrics["source_citation"] += has_source_citation(answer)
    
    # 平均分
    for key in metrics:
        metrics[key] /= len(test_data)
    
    return metrics

# 对比微调前后
before = evaluate_model(base_model, test_set)
after = evaluate_model(finetuned_model, test_set)

print(f"准确性提升：{after['accuracy'] - before['accuracy']:.2%}")
print(f"完整性提升：{after['completeness'] - before['completeness']:.2%}")

🎯 三、实战建议

关键成功因素

先优化Prompt，再考虑微调
- 90%的问题Prompt能解决
- 微调成本高，收益递减
数据质量>数量
- 100条高质量 > 1000条低质量
- 必须人工审核
持续迭代
- 每周收集反馈
- 每月优化一次
- 建立质量监控体系
A/B测试
- 每次改动都对比效果
- 用数据说话

posted @ 2026-01-16 16:40 XiaoZhengTou 阅读(0) 评论(0) 收藏举报

刷新页面返回顶部

前端+AI的结合

RAG系统核心难点与模型微调实战指南

RAG系统核心难点与模型微调实战指南

🎯 一、项目实施的5大难点

难点1：检索不准确（最常见！）

方案A：优化分块策略（最简单，效果显著）⭐⭐⭐⭐⭐

方案B：增强元数据（中等难度，效果好）⭐⭐⭐⭐

方案C：混合检索（中高难度）⭐⭐⭐⭐

难点2：答案质量不稳定

方案A：Prompt工程（立即见效）⭐⭐⭐⭐⭐

方案B：降低Temperature（简单有效）⭐⭐⭐⭐

方案C：答案验证机制（高级）⭐⭐⭐⭐

难点3：公式和特殊符号处理

难点4：图表内容缺失

方案A：人工标注（最准确）⭐⭐⭐⭐⭐

方案B：多模态模型自动生成（自动化）⭐⭐⭐⭐

难点5：多轮对话的上下文理解

🎓 二、模型微调完整指南

什么时候需要微调？

微调方案选择

方案1：Prompt优化（推荐先做）⭐⭐⭐⭐⭐

方案2：Few-Shot学习（效果显著）⭐⭐⭐⭐

方案3：LoRA微调（深度定制）⭐⭐⭐⭐⭐

Step 1：准备微调数据

Step 2：使用LLaMA-Factory微调（最简单）

Step 3：使用unsloth微调（更快）

Step 4：部署微调后的模型

微调效果评估

🎯 三、实战建议

推荐的优化顺序

关键成功因素

公告