HuggingFace课程 - 随笔分类(第3页) - 有何m不可

HuggingFace课程-4. 分享你的模型和标记器 The Hugging Face Hub

摘要：The Hugging Face Hub 我们的主网站——— Hugging Face中心是一个集发现、使用及贡献最新先进模型与数据集为一体的中心平台。这里汇聚了超过 10,000 个公开可用的各种领域的模型。我们将在本章节专注探讨这些模型，并在第五章节深入讨论数据集。 Hub 中的模型不仅限于� 阅读全文

posted @ 2025-08-26 17:04 有何m不可阅读(27) 评论(0) 推荐(0)

HuggingFace课程-3. 微调一个预训练模型微调，检查！

摘要：微调，检查！这是非常令人高兴的！在前两章中，你了解了模型和 Tokenizer，现在你知道如何针对你自己的数据对它们进行微调。回顾一下，在本章中，你：了解了 Hub 中的数据集学习了如何加载和预处理数据集，包括使用动态填充和数据整理器实现你自己的模型微调和评估实现了一个较为底层的训练循环阅读全文

posted @ 2025-08-26 17:02 有何m不可阅读(25) 评论(0) 推荐(0)

HuggingFace课程-3. 微调一个预训练模型一个完整的训练

摘要：一个完整的训练现在，我们将了解如何在不使用 Trainer 类的情况下实现与上一节相同的结果。同样，我们假设你已经完成了第 2 节中的数据处理。下面对第 2 节内容的一个简短总结，涵盖了你需要在本节之前运行的所有内容： from datasets import load_dataset from 阅读全文

posted @ 2025-08-26 17:00 有何m不可阅读(35) 评论(0) 推荐(0)

HuggingFace课程-3. 微调一个预训练模型使用 Trainer API 微调模型

摘要：使用 Trainer API 微调模型 🤗 Transformers 提供了一个 Trainer 类，可以帮助你在数据集上微调任何预训练模型。在上一节中完成所有数据预处理工作后，你只需完成几个步骤来定义 Trainer 。最困难的部分可能是准备运行 Trainer.train() 所需的环境，因为阅读全文

posted @ 2025-08-26 15:06 有何m不可阅读(59) 评论(0) 推荐(0)

HuggingFace课程-3. 微调一个预训练模型处理数据

摘要：处理数据在这一小节你将学习第一小节中提到的“如何使用模型中心（hub）加载大型数据集”，下面是用模型中心的数据在 PyTorch 上训练句子分类器的一个例子： import torch from torch.optim import AdamW from transformers import 阅读全文

posted @ 2025-08-26 14:50 有何m不可阅读(37) 评论(0) 推荐(0)

HuggingFace课程-3. 微调一个预训练模型本章简介

摘要：本章简介在第二章我们探索了如何使用 Tokenizer 和预训练模型进行预测。那么如何使用自己的数据集微调预训练模型呢？本章将解决这个问题！你将学到：如何从模型中心（hub）加载大型数据集如何使用高级的 Trainer API 微调一个模型如何使用自定义训练过程如何利用🤗 Accel 阅读全文

posted @ 2025-08-26 14:40 有何m不可阅读(20) 评论(0) 推荐(0)

HuggingFace课程-2. 使用 🤗 Transformers 基本用法完成

摘要：基本用法完成！恭喜你跟随课程走到这里！回顾一下，在这一章中，你已经：学习了 Transformers 模型的基本构造块。了解了 Tokenizer 管道的组成。了解了如何在实践中使用 Transformers 模型。学习了如何利用 tokenizer 将文本转换为模型可以理解的张量。设定阅读全文

posted @ 2025-08-26 14:38 有何m不可阅读(21) 评论(0) 推荐(0)

HuggingFace课程-2. 使用 🤗 Transformers 综合应用

摘要：综合应用在过去的几个章节中，我们已经尝试尽可能手动完成大部分工作。我们探索了 tokenizer 的运行机制，并且了解了分词、转换为 inputs ID、填充、截断以及注意力掩码的处理方式。然而，正如我们在第二节中看到的那样，🤗 Transformers API 能够通过一个高级函数为我们处理阅读全文

posted @ 2025-08-26 14:37 有何m不可阅读(15) 评论(0) 推荐(0)

HuggingFace课程-2. 使用 🤗 Transformers 处理多个序列

摘要：处理多个序列在上一节中，我们探讨了最简单的案例：对一个较短的句子进行推理。然而，一些问题已经出现：我们如何处理多个句子？我们如何处理不同长度的多个句子？词汇索引是唯一可以让模型运行的输入吗？是否存在句子太长的问题？让我们看看这些问题会带来什么样的问题，以及如何使用🤗 Transform 阅读全文

posted @ 2025-08-26 14:31 有何m不可阅读(17) 评论(0) 推荐(0)

HuggingFace课程-2. 使用 🤗 Transformers 标记器（Tokenizer）

摘要：Tokenizers tokenizer 是 NLP 管道的核心组件之一。它们有一个非常明确的目的：将文本转换为模型可以处理的数据。模型只能处理数字，因此 tokenizer 需要将我们的文本输入转换为数字。在本节中，我们将确切地探讨 tokenization 管道中发生的事情。在 NLP 任务中阅读全文

posted @ 2025-08-26 14:26 有何m不可阅读(85) 评论(0) 推荐(0)

HuggingFace课程-2. 使用 🤗 Transformers 模型

摘要：模型在本节中，我们将更详细地了解如何创建和使用模型。我们将使用 AutoModel 类，当你希望从 checkpoint 实例化任何模型时，使用它非常方便。 AutoModel 类及其所有的相关类其实就是对库中可用的各种模型的简单包装。它是一个智能的包装，因为它可以自动猜测你的 checkpoin 阅读全文

posted @ 2025-08-26 11:54 有何m不可阅读(42) 评论(0) 推荐(0)

HuggingFace课程-2. 使用 🤗 Transformers 管道的内部

摘要：Pipeline 的内部这是第一部分，根据你使用 PyTorch 或者 TensorFlow，内容略有不同。点击标题上方的平台，选择你喜欢的平台！让我们从一个完整的示例开始，看看在第一章中执行以下代码时在幕后发生了什么 from transformers import pipeline cl 阅读全文

posted @ 2025-08-26 11:22 有何m不可阅读(19) 评论(0) 推荐(0)

HuggingFace课程-2. 使用 🤗 Transformers 本章简介

摘要：本章简介正如你在第一章，中看到的那样，Transformers 模型通常规模庞大。包含数以百万计到数千万计数十亿的参数，训练和部署这些模型是一项复杂的任务。再者，新模型的推出几乎日新月异，而每种模型都有其独特的实现方式，尝试全部模型绝非易事。 🤗 Transformers 库应运而生，就是为阅读全文

posted @ 2025-08-26 11:13 有何m不可阅读(30) 评论(0) 推荐(0)

HuggingFace课程-1.Transformer模型总结

摘要：总结在本章中，你了解了如何使用来自🤗Transformers 的高级函数 pipeline() 处理不同的 NLP 任务。你还了解了如何在模型中心（hub）中搜索和使用模型，以及如何使用推理 API 直接在浏览器中测试模型。我们从最终的效果的角度讨论了 Transformer 模型的工作方式，阅读全文

posted @ 2025-08-26 11:11 有何m不可阅读(22) 评论(0) 推荐(0)

HuggingFace课程-1.Transformer模型偏见和局限性

摘要：偏见和局限性如果你打算在正式的项目中使用经过预训练或经过微调的模型。请注意：虽然这些模型是很强大，但它们也有局限性。其中最大的一个问题是，为了对大量数据进行预训练，研究人员通常会搜集所有他们能找到的所有文字内容，中间可能夹带一些意识形态或者价值观的刻板印象。为了快速解释清楚这个问题，让我们回到一阅读全文

posted @ 2025-08-26 10:40 有何m不可阅读(29) 评论(0) 推荐(0)

HuggingFace课程-1.Transformer模型编码器-解码器模型

摘要：编码器-解码器模型编码器-解码器模型（也称为序列到序列模型）同时使用 Transformer 架构的编码器和解码器两个部分。在每个阶段，编码器的注意力层可以访问输入句子中的所有单词，而解码器的注意力层只能访问位于输入中将要预测单词前面的单词。这些模型的预训练可以使用训练编码器或解码器模型的方式来阅读全文

posted @ 2025-08-26 10:37 有何m不可阅读(25) 评论(0) 推荐(0)

HuggingFace课程-1.Transformer模型解码器模型

摘要：“解码器”模型 “解码器”模型仅使用 Transformer 模型的解码器部分。在每个阶段，对于给定的单词，注意力层只能获取到句子中位于将要预测单词前面的单词。这些模型通常被称为自回归模型。 “解码器”模型的预训练通常围绕预测句子中的下一个单词进行。这些模型最适合处理文本生成的任务。该系列模型的阅读全文

posted @ 2025-08-26 10:35 有何m不可阅读(19) 评论(0) 推荐(0)

HuggingFace课程-1.Transformer模型编码器模型

摘要：“编码器”模型编码器模型仅使用 Transformer 模型的编码器部分。在每次计算过程中，注意力层都能访问整个句子的所有单词，这些模型通常具有“双向”（向前/向后）注意力，被称为自编码模型。这些模型的预训练通常会使用某种方式破坏给定的句子（例如：通过随机遮盖其中的单词），并让模型寻找或重建给定阅读全文

posted @ 2025-08-26 10:34 有何m不可阅读(20) 评论(0) 推荐(0)

HuggingFace课程-1.Transformer模型 Transformers 是如何工作的？

摘要：Transformers 是如何工作的？在本节中，我们简要了解 Transformer 模型的架构。一点 Transformers 的发展历史以下是 Transformer 模型（简要）历史中的一些关键节点： Transformer 架构于 2017 年 6 月提出。原本研究的重点是翻译任务阅读全文

posted @ 2025-08-26 09:09 有何m不可阅读(34) 评论(0) 推荐(0)

HuggingFace课程-1.Transformer模型 Transformers 能做什么？

摘要：Transformers 能做什么？在本节中，我们将看看 Transformer 模型可以做什么，并使用 🤗 Transformers 库中的第一个工具： pipeline() 函数。 👀 看到那个右上角的在 Colab 中打开（Open in Colab）的按钮了吗？单击它就可以打开一个包含阅读全文

posted @ 2025-08-25 18:53 有何m不可阅读(52) 评论(0) 推荐(0)

gongzb

随笔分类 - AI / HuggingFace课程

公告