上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 20 下一页
摘要: 微调,检查! 这是非常令人高兴的!在前两章中,你了解了模型和 Tokenizer,现在你知道如何针对你自己的数据对它们进行微调。回顾一下,在本章中,你: 了解了 Hub 中的数据集 学习了如何加载和预处理数据集,包括使用动态填充和数据整理器 实现你自己的模型微调和评估 实现了一个较为底层的训练循环 阅读全文
posted @ 2025-08-26 17:02 有何m不可 阅读(21) 评论(0) 推荐(0)
摘要: 一个完整的训练 现在,我们将了解如何在不使用 Trainer 类的情况下实现与上一节相同的结果。同样,我们假设你已经完成了第 2 节中的数据处理。下面对第 2 节内容的一个简短总结,涵盖了你需要在本节之前运行的所有内容: from datasets import load_dataset from 阅读全文
posted @ 2025-08-26 17:00 有何m不可 阅读(29) 评论(0) 推荐(0)
摘要: 使用 Trainer API 微调模型 🤗 Transformers 提供了一个 Trainer 类,可以帮助你在数据集上微调任何预训练模型。在上一节中完成所有数据预处理工作后,你只需完成几个步骤来定义 Trainer 。最困难的部分可能是准备运行 Trainer.train() 所需的环境,因为 阅读全文
posted @ 2025-08-26 15:06 有何m不可 阅读(51) 评论(0) 推荐(0)
摘要: 处理数据 在这一小节你将学习 第一小节 中提到的“如何使用模型中心(hub)加载大型数据集”,下面是用模型中心的数据在 PyTorch 上训练句子分类器的一个例子: import torch from torch.optim import AdamW from transformers import 阅读全文
posted @ 2025-08-26 14:50 有何m不可 阅读(35) 评论(0) 推荐(0)
摘要: 本章简介 在 第二章 我们探索了如何使用 Tokenizer 和预训练模型进行预测。那么如何使用自己的数据集微调预训练模型呢?本章将解决这个问题!你将学到: 如何从模型中心(hub)加载大型数据集 如何使用高级的 Trainer API 微调一个模型 如何使用自定义训练过程 如何利用🤗 Accel 阅读全文
posted @ 2025-08-26 14:40 有何m不可 阅读(19) 评论(0) 推荐(0)
摘要: 基本用法完成! 恭喜你跟随课程走到这里!回顾一下,在这一章中,你已经: 学习了 Transformers 模型的基本构造块。 了解了 Tokenizer 管道的组成。 了解了如何在实践中使用 Transformers 模型。 学习了如何利用 tokenizer 将文本转换为模型可以理解的张量。 设定 阅读全文
posted @ 2025-08-26 14:38 有何m不可 阅读(20) 评论(0) 推荐(0)
摘要: 综合应用 在过去的几个章节中,我们已经尝试尽可能手动完成大部分工作。我们探索了 tokenizer 的运行机制,并且了解了分词、转换为 inputs ID、填充、截断以及注意力掩码的处理方式。 然而,正如我们在第二节中看到的那样,🤗 Transformers API 能够通过一个高级函数为我们处理 阅读全文
posted @ 2025-08-26 14:37 有何m不可 阅读(14) 评论(0) 推荐(0)
摘要: 处理多个序列 在上一节中,我们探讨了最简单的案例:对一个较短的句子进行推理。然而,一些问题已经出现: 我们如何处理多个句子? 我们如何处理不同长度的多个句子? 词汇索引是唯一可以让模型运行的输入吗? 是否存在句子太长的问题? 让我们看看这些问题会带来什么样的问题,以及如何使用🤗 Transform 阅读全文
posted @ 2025-08-26 14:31 有何m不可 阅读(15) 评论(0) 推荐(0)
摘要: Tokenizers tokenizer 是 NLP 管道的核心组件之一。它们有一个非常明确的目的:将文本转换为模型可以处理的数据。模型只能处理数字,因此 tokenizer 需要将我们的文本输入转换为数字。在本节中,我们将确切地探讨 tokenization 管道中发生的事情。 在 NLP 任务中 阅读全文
posted @ 2025-08-26 14:26 有何m不可 阅读(78) 评论(0) 推荐(0)
摘要: 模型 在本节中,我们将更详细地了解如何创建和使用模型。我们将使用 AutoModel 类,当你希望从 checkpoint 实例化任何模型时,使用它非常方便。 AutoModel 类及其所有的相关类其实就是对库中可用的各种模型的简单包装。它是一个智能的包装,因为它可以自动猜测你的 checkpoin 阅读全文
posted @ 2025-08-26 11:54 有何m不可 阅读(39) 评论(0) 推荐(0)
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 20 下一页