Transformers--4-37-中文文档-十二-

Transformers 4.37 中文文档（十二）

原文：huggingface.co/docs/transformers

BERTweet

原文链接：huggingface.co/docs/transformers/v4.37.2/en/model_doc/bertweet

概述

BERTweet 模型是由 Dat Quoc Nguyen、Thanh Vu 和 Anh Tuan Nguyen 在BERTweet: A pre-trained language model for English Tweets中提出的。

从论文中摘录如下：

我们提出了 BERTweet，这是第一个用于英文推文的公开大规模预训练语言模型。我们的 BERTweet 与 BERT-base（Devlin 等人，2019）具有相同的架构，使用 RoBERTa 预训练过程进行训练（Liu 等人，2019）。实验表明，BERTweet 优于强基线 RoBERTa-base 和 XLM-R-base（Conneau 等人，2020），在三个推文 NLP 任务（词性标注、命名实体识别和文本分类）上产生比先前最先进模型更好的性能结果。

此模型由dqnguyen贡献。原始代码可在此处找到。

用法示例

>>> import torch
>>> from transformers import AutoModel, AutoTokenizer

>>> bertweet = AutoModel.from_pretrained("vinai/bertweet-base")

>>> # For transformers v4.x+:
>>> tokenizer = AutoTokenizer.from_pretrained("vinai/bertweet-base", use_fast=False)

>>> # For transformers v3.x:
>>> # tokenizer = AutoTokenizer.from_pretrained("vinai/bertweet-base")

>>> # INPUT TWEET IS ALREADY NORMALIZED!
>>> line = "SC has first two presumptive cases of coronavirus , DHEC confirms HTTPURL via @USER :cry:"

>>> input_ids = torch.tensor([tokenizer.encode(line)])

>>> with torch.no_grad():
...     features = bertweet(input_ids)  # Models outputs are now tuples

>>> # With TensorFlow 2.0+:
>>> # from transformers import TFAutoModel
>>> # bertweet = TFAutoModel.from_pretrained("vinai/bertweet-base")

此实现与 BERT 相同，仅在分词方法上有所不同。有关 API 参考信息，请参考 BERT 文档。

龙哥盟

掠夺·扩张·投机·博弈

Transformers--4-37-中文文档-十二-

Transformers 4.37 中文文档（十二）

BERTweet

概述

用法示例

BertweetTokenizer

class transformers.BertweetTokenizer

add_from_file

build_inputs_with_special_tokens

convert_tokens_to_string

create_token_type_ids_from_sequences

get_special_tokens_mask

normalizeToken

normalizeTweet

BigBird

概述

使用提示

资源

BigBirdConfig

class transformers.BigBirdConfig

BigBirdTokenizer

class transformers.BigBirdTokenizer

build_inputs_with_special_tokens

get_special_tokens_mask

create_token_type_ids_from_sequences

save_vocabulary

BigBirdTokenizerFast

class transformers.BigBirdTokenizerFast

build_inputs_with_special_tokens

create_token_type_ids_from_sequences

get_special_tokens_mask

BigBird 特定输出

class transformers.models.big_bird.modeling_big_bird.BigBirdForPreTrainingOutput

BigBirdModel

class transformers.BigBirdModel

forward

BigBirdForPreTraining

class transformers.BigBirdForPreTraining

BigBirdForCausalLM

class transformers.BigBirdForCausalLM

forward

BigBirdForMaskedLM

class transformers.BigBirdForMaskedLM

forward

BigBirdForSequenceClassification

class transformers.BigBirdForSequenceClassification

forward

BigBirdForMultipleChoice

class transformers.BigBirdForMultipleChoice

forward

BigBirdForTokenClassification

class transformers.BigBirdForTokenClassification

forward

BigBirdForQuestionAnswering

class transformers.BigBirdForQuestionAnswering

forward

FlaxBigBirdModel

class transformers.FlaxBigBirdModel

__call__

FlaxBigBirdForPreTraining

class transformers.FlaxBigBirdForPreTraining

__call__

FlaxBigBirdForCausalLM

class transformers.FlaxBigBirdForCausalLM

__call__

FlaxBigBirdForMaskedLM

class transformers.FlaxBigBirdForMaskedLM

__call__

FlaxBigBirdForSequenceClassification

class transformers.FlaxBigBirdForSequenceClassification

__call__

FlaxBigBirdForMultipleChoice

class transformers.FlaxBigBirdForMultipleChoice

__call__

FlaxBigBirdForTokenClassification

class transformers.FlaxBigBirdForTokenClassification

__call__

FlaxBigBirdForQuestionAnswering

`class transformers.BertweetTokenizer`

`add_from_file`

`build_inputs_with_special_tokens`

`convert_tokens_to_string`

`create_token_type_ids_from_sequences`

`get_special_tokens_mask`

`normalizeToken`

`normalizeTweet`

`class transformers.BigBirdConfig`

`class transformers.BigBirdTokenizer`

`build_inputs_with_special_tokens`

`get_special_tokens_mask`

`create_token_type_ids_from_sequences`

`save_vocabulary`

`class transformers.BigBirdTokenizerFast`

`build_inputs_with_special_tokens`

`create_token_type_ids_from_sequences`

`get_special_tokens_mask`

`class transformers.models.big_bird.modeling_big_bird.BigBirdForPreTrainingOutput`

`class transformers.BigBirdModel`

`forward`

`class transformers.BigBirdForPreTraining`

`class transformers.BigBirdForCausalLM`

`forward`

`class transformers.BigBirdForMaskedLM`

`forward`

`class transformers.BigBirdForSequenceClassification`

`forward`

`class transformers.BigBirdForMultipleChoice`

`forward`

`class transformers.BigBirdForTokenClassification`

`forward`

`class transformers.BigBirdForQuestionAnswering`

`forward`

`class transformers.FlaxBigBirdModel`

`call`

`class transformers.FlaxBigBirdForPreTraining`

`call`

`class transformers.FlaxBigBirdForCausalLM`

`call`

`class transformers.FlaxBigBirdForMaskedLM`

`call`

`class transformers.FlaxBigBirdForSequenceClassification`

`call`

`class transformers.FlaxBigBirdForMultipleChoice`

`call`

`class transformers.FlaxBigBirdForTokenClassification`

`call`

`class transformers.FlaxBigBirdForQuestionAnswering`

`call`

`class transformers.BigBirdPegasusConfig`

`class transformers.BigBirdPegasusModel`

`forward`

`class transformers.BigBirdPegasusForConditionalGeneration`

`forward`

`class transformers.BigBirdPegasusForSequenceClassification`

`forward`

`class transformers.BigBirdPegasusForQuestionAnswering`

`forward`

`class transformers.BigBirdPegasusForCausalLM`

`forward`

`class transformers.BioGptConfig`

`class transformers.BioGptTokenizer`

`save_vocabulary`

`class transformers.BioGptModel`

`forward`

`class transformers.BioGptForCausalLM`

`forward`

`class transformers.BioGptForTokenClassification`

`forward`

`class transformers.BioGptForSequenceClassification`

`forward`

`class transformers.BlenderbotConfig`

`class transformers.BlenderbotTokenizer`

`build_inputs_with_special_tokens`

`class transformers.BlenderbotTokenizerFast`

`build_inputs_with_special_tokens`

`class transformers.BlenderbotModel`

`forward`

`class transformers.BlenderbotForConditionalGeneration`