Transformers--4-37-中文文档-十八-

Transformers 4.37 中文文档（十八）

原文：huggingface.co/docs/transformers

FNet

原文链接: huggingface.co/docs/transformers/v4.37.2/en/model_doc/fnet

概述

FNet 模型由 James Lee-Thorp, Joshua Ainslie, Ilya Eckstein, Santiago Ontanon 在 FNet: Mixing Tokens with Fourier Transforms 中提出。该模型用傅立叶变换替换了 BERT 模型中的自注意力层，仅返回变换的实部。该模型比 BERT 模型快得多，因为它具有更少的参数并且更节省内存。该模型在 GLUE 基准测试中达到了约 92-97% 的准确率，并且比 BERT 模型训练速度更快。论文的摘要如下：

我们展示了 Transformer 编码器架构可以通过用简单的线性变换替换自注意力子层来加速，且准确性损失有限。这些线性混合器，以及前馈层中的标准非线性，在几个文本分类任务中证明了在建模语义关系方面的能力。最令人惊讶的是，我们发现将 Transformer 编码器中的自注意力子层替换为标准的、无参数的傅立叶变换，在 GLUE 基准测试中达到了 BERT 对应模型准确率的 92-97%，但在 GPU 上训练速度快 80%，在 TPU 上快 70%，在标准的 512 输入长度下。在更长的输入长度下，我们的 FNet 模型速度显著更快：与 Long Range Arena 基准测试中的“高效”Transformer 相比，FNet 在 GPU 上与最准确的模型匹敌，同时在所有序列长度上超过最快的模型（在 TPU 上相对较短的长度）。最后，FNet 具有轻量级的内存占用，并且在较小的模型尺寸上特别高效；对于固定的速度和准确性预算，小型的 FNet 模型胜过 Transformer 对应模型。

该模型由 gchhablani 贡献。原始代码可以在这里找到。

使用提示

该模型在训练时没有使用注意力掩码，因为它基于傅立叶变换。该模型在最大序列长度为 512 的情况下进行训练，其中包括填充标记。因此，强烈建议在微调和推理时使用相同的最大序列长度。

资源

文本分类任务指南
标记分类任务指南
问答任务指南
遮蔽语言建模任务指南
多选任务指南

龙哥盟

掠夺·扩张·投机·博弈

Transformers--4-37-中文文档-十八-

Transformers 4.37 中文文档（十八）

FNet

概述

使用提示

资源

FNetConfig

class transformers.FNetConfig

FNetTokenizer

class transformers.FNetTokenizer

build_inputs_with_special_tokens

get_special_tokens_mask

create_token_type_ids_from_sequences

save_vocabulary

FNetTokenizerFast

class transformers.FNetTokenizerFast

build_inputs_with_special_tokens

create_token_type_ids_from_sequences

FNetModel

class transformers.FNetModel

forward

FNetForPreTraining

class transformers.FNetForPreTraining

FNetForMaskedLM

class transformers.FNetForMaskedLM

forward

FNetForNextSentencePrediction

class transformers.FNetForNextSentencePrediction

forward

FNetForSequenceClassification

class transformers.FNetForSequenceClassification

forward

FNetForMultipleChoice

class transformers.FNetForMultipleChoice

forward

FNetForTokenClassification

class transformers.FNetForTokenClassification

forward

FNetForQuestionAnswering

class transformers.FNetForQuestionAnswering

forward

FSMT

概述

实现说明

FSMTConfig

class transformers.FSMTConfig

FSMTTokenizer

class transformers.FSMTTokenizer

build_inputs_with_special_tokens

get_special_tokens_mask

create_token_type_ids_from_sequences

save_vocabulary

FSMTModel

class transformers.FSMTModel

前向

FSMTForConditionalGeneration

class transformers.FSMTForConditionalGeneration

forward

Funnel Transformer

概述

使用提示

资源

FunnelConfig

class transformers.FunnelConfig

FunnelTokenizer

class transformers.FunnelTokenizer

build_inputs_with_special_tokens

get_special_tokens_mask

create_token_type_ids_from_sequences

save_vocabulary

FunnelTokenizerFast

class transformers.FunnelTokenizerFast

build_inputs_with_special_tokens

create_token_type_ids_from_sequences

Funnel 特定输出

class transformers.models.funnel.modeling_funnel.FunnelForPreTrainingOutput

class transformers.models.funnel.modeling_tf_funnel.TFFunnelForPreTrainingOutput

FunnelBaseModel

`class transformers.FNetConfig`

`class transformers.FNetTokenizer`

`build_inputs_with_special_tokens`

`get_special_tokens_mask`

`create_token_type_ids_from_sequences`

`save_vocabulary`

`class transformers.FNetTokenizerFast`

`build_inputs_with_special_tokens`

`create_token_type_ids_from_sequences`

`class transformers.FNetModel`

`forward`

`class transformers.FNetForPreTraining`

`class transformers.FNetForMaskedLM`

`forward`

`class transformers.FNetForNextSentencePrediction`

`forward`

`class transformers.FNetForSequenceClassification`

`forward`

`class transformers.FNetForMultipleChoice`

`forward`

`class transformers.FNetForTokenClassification`

`forward`

`class transformers.FNetForQuestionAnswering`

`forward`

`class transformers.FSMTConfig`

`class transformers.FSMTTokenizer`

`build_inputs_with_special_tokens`

`get_special_tokens_mask`

`create_token_type_ids_from_sequences`

`save_vocabulary`

`class transformers.FSMTModel`

`前向`

`class transformers.FSMTForConditionalGeneration`

`forward`

`class transformers.FunnelConfig`

`class transformers.FunnelTokenizer`

`build_inputs_with_special_tokens`

`get_special_tokens_mask`

`create_token_type_ids_from_sequences`

`save_vocabulary`

`class transformers.FunnelTokenizerFast`

`build_inputs_with_special_tokens`

`create_token_type_ids_from_sequences`

`class transformers.models.funnel.modeling_funnel.FunnelForPreTrainingOutput`

`class transformers.models.funnel.modeling_tf_funnel.TFFunnelForPreTrainingOutput`

`class transformers.FunnelBaseModel`

`forward`

`class transformers.FunnelModel`

`forward`

`class transformers.FunnelForPreTraining`

`forward`

`class transformers.FunnelForMaskedLM`

`forward`

`class transformers.FunnelForSequenceClassification`

`forward`

`class transformers.FunnelForMultipleChoice`

`forward`

`forward`

`class transformers.FunnelForQuestionAnswering`

`class transformers.TFFunnelBaseModel`

`call`

`class transformers.TFFunnelModel`

`call`

`class transformers.TFFunnelForPreTraining`

`call`

`class transformers.TFFunnelForMaskedLM`

`call`

`class transformers.TFFunnelForSequenceClassification`

`call`

`class transformers.TFFunnelForMultipleChoice`

`call`

`class transformers.TFFunnelForTokenClassification`

`call`

`class transformers.TFFunnelForQuestionAnswering`

`call`

`class transformers.FuyuConfig`