Come eseguire la classificazione del testo utilizzando i trasformatori

Come Eseguire La Classificazione Del Testo Utilizzando I Trasformatori



In questa era, i Transformer sono i modelli più potenti che hanno fornito i migliori risultati in molteplici operazioni di NLP (Natural Language Processing). Inizialmente, veniva utilizzato per attività di modellazione linguistica, tra cui la generazione di testo, la classificazione, la traduzione automatica e molto altro. Ma ora viene utilizzato anche per il riconoscimento di oggetti, la classificazione delle immagini e molte altre attività di visione artificiale.

In questo tutorial forniremo la procedura per eseguire la classificazione del testo utilizzando Transformers.







Come eseguire la classificazione del testo utilizzando i trasformatori?

Per eseguire la classificazione del testo utilizzando Transformers, innanzitutto installare il “ trasformatori ' libreria eseguendo il comando fornito:



! pip installare trasformatori


Come puoi vedere, la libreria specificata è stata installata con successo:




Quindi, importa il ' tubatura ' dal ' trasformatori ' biblioteca:





dalla pipeline di importazione di trasformatori


Ecco, il “ tubatura ' includerà l'attività PNL che dobbiamo eseguire e il modello di trasformatore desiderato per questa operazione insieme al tokenizzatore.

Nota: Il tokenizzatore viene utilizzato per eseguire l'elaborazione del testo da fornire all'input del modello separando il testo in token.



Successivamente, utilizzare il ' tubatura() ' e passargli il ' classificazione a colpo zero ' come argomento. Successivamente, passa un altro parametro che è il nostro modello. Stiamo usando Facebook' BART 'modello del trasformatore. Qui non utilizziamo il tokenizer perché può essere dedotto automaticamente dal modello specificato:

text_classifier = pipeline ( 'classificazione zero-shot' , modello = 'facebook/bart-large-mnli' )


Ora, dichiara il “ segg ' variabile che contiene il nostro testo di input che deve essere classificato. Quindi, forniamo le categorie in cui vogliamo classificare il testo e salvare nella sezione ' laboratorio ' che è noto come etichette:

segg = 'La correzione di bozze e l'editing sono componenti necessarie per garantire chiarezza, coerenza e contenuti privi di errori'
laboratorio = [ 'aggiornamento' , 'errore' , 'importante' , 'verifica' ]


Infine, esegui la pipeline insieme all'input:

classificatore_testo ( segg , laboratorio )


Dopo aver eseguito la pipeline, come puoi vedere il modello prevede che la sequenza fornita venga classificata:


Informazioni aggiuntive: Se vuoi accelerare le prestazioni del modello, devi utilizzare la GPU. Se sì, allora, a tale scopo, puoi specificare un argomento del dispositivo nella pipeline e impostarlo su ' 0 ' per utilizzare la GPU.

Se desideri classificare il testo su più di una sequenza/istruzione di testo di input, puoi aggiungerli a un elenco e passarlo come input alle pipeline. A tale scopo, controlla lo snippet di codice:

segg = [ 'La correzione di bozze e l'editing sono componenti necessarie per garantire chiarezza, coerenza e contenuti privi di errori' ,
'In questa era moderna, l'ottimizzazione SEO è essenziale affinché gli articoli si classifichino bene e raggiungano un pubblico più ampio' ]

classificatore_testo ( segg , laboratorio )


Produzione


Questo è tutto! Abbiamo compilato il modo più semplice per eseguire la classificazione del testo utilizzando Transformers.

Conclusione

I trasformatori vengono utilizzati per eseguire attività di modellazione del linguaggio, come la generazione di testo, la classificazione del testo e la traduzione automatica, nonché attività di visione artificiale tra cui il riconoscimento di oggetti e la classificazione delle immagini. In questo tutorial, abbiamo illustrato il processo per eseguire la classificazione del testo utilizzando Transformers.