广州外贸建站,网站建设的需求,邢台网络公司做网站,优化网站排名费用概念
1、零样本分类#xff1a;在没有样本标签的情况下对文本进行分类。
2、nli:(Natural Language Inference),自然语言推理
3、xnli:(Cross-Lingual Natural Language Inference) ,是一种数据集#xff0c;支持15种语言#xff0c;数据集包含10个领域#xff0c;每个领…概念
1、零样本分类在没有样本标签的情况下对文本进行分类。
2、nli:(Natural Language Inference),自然语言推理
3、xnli:(Cross-Lingual Natural Language Inference) ,是一种数据集支持15种语言数据集包含10个领域每个领域包含750条样本10个领域共计7500条人工标注的英文测试样本组成了112500对英文--其他语种的标注对。每条数据样本由两个句子组成分别是前提和假设前提和假设之间的关系有entailment蕴含、contradiction矛盾、neutral中立三类。 模型
1、手动下载MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7到本地urlMoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7 at main
2、Git下载
git lfs install
git clone https://huggingface.co/MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7代码
保存为m.py文件
import torch
import torch.nn.functional as F
from transformers import AutoTokenizer, AutoModelForSequenceClassification
from transformers import pipeline
model_name mDeBERTa-v3-base-xnli-multilingual-nli-2mil7
tokenizer AutoTokenizer.from_pretrained(model_name)
model AutoModelForSequenceClassification.from_pretrained(model_name)
classifier pipeline(text-classification, modelmodel, tokenizertokenizer)
for aspect in [camera, phone]:print(aspect, classifier(The camera quality of this phone is amazing., text_pairaspect))
输出:
[ipacomm-agi-p]$ python m.py
camera [{label: entailment, score: 0.9938687682151794}]
phone [{label: entailment, score: 0.9425390362739563}]