Hugging Face Transformers模型如何使用

沈巴英

2023-12-01

Hugging Face Transformers是一个基于PyTorch和TensorFlow的开源库，用于实现各种预训练的Transformer模型。下面是一个使用Hugging Face Transformers实现文本分类任务的代码示例：

from transformers import BertTokenizer, BertForSequenceClassification
import torch

tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
model = BertForSequenceClassification.from_pretrained('bert-base-uncased')

input_text = "Hello, how are you today?"
input_ids = torch.tensor(tokenizer.encode(input_text, add_special_tokens=True)).unsqueeze(0)
outputs = model(input_ids)

logits = outputs[0]
predicted_class = torch.argmax(logits, dim=1)

print(predicted_class)

在这个示例中，我们首先使用BertTokenizer类来将输入文本转换为Bert模型的输入格式。然后，我们使用BertForSequenceClassification类来加载预训练的Bert模型。接着，我们将输入文本编码为Bert模型的输入格式，并将其传入模型进行推理。最后，我们使用argmax函数来预测文本的分类结果。

Hugging Face Transformers库提供了许多其他的预训练Transformer模型，包括GPT、RoBERTa等。你可以使用相似的方法来加载和使用这些模型，只需要将Bert相关的类和函数替换为相应的类和函数即可。

上面代码的输出是一个PyTorch张量，表示输入文本的预测分类结果。在这个示例中，由于我们只输入了一条文本，因此输出张量只有一个元素，表示这个文本的分类结果。具体来说，输出张量的值是一个数字，表示模型预测的文本类别，你可以根据你的具体任务和模型设置不同的类别标签。如果你的任务是二分类任务，那么输出值为0表示负类，输出值为1表示正类。如果你的任务是多分类任务，那么输出值就对应着不同的类别。

linux系统相关 - 知乎 (zhihu.com)

Hugging Face Transformers模型如何使用

相关阅读

相关文章

相关问答

相关文档