Come installare Tesseract su Windows

Come Installare Tesseract Su Windows



Tesseract è uno strumento di riconoscimento del testo open source disponibile gratuitamente noto anche come OCR (Riconoscimento ottico dei caratteri). Viene utilizzato principalmente per identificare ed estrarre testo dalle immagini. Leggerà il testo dai dati dell'immagine e scriverà l'output in un nuovo file .txt. Tesseract funziona anche con Python, poiché viene utilizzato principalmente per riconoscere la scrittura a mano dalle immagini. Utilizza il modello LSTR (memoria a lungo termine). Tesseract funziona con la licenza Apache 2.0.

In questo blog elaboreremo il metodo per installare Tesseract su Windows.







Quindi iniziamo!



Come installare Tesseract su Windows?

Il Tesseract è uno strumento da riga di comando utilizzato per l'estrazione di testo dalle immagini. Per installare Tesseract su Windows, è necessario seguire le istruzioni fornite di seguito.



Passaggio 1: scarica il programma di installazione di Tesseract





Innanzitutto, vai al collegamento fornito di seguito e scarica il programma di installazione di Tesseract in base alle specifiche del tuo sistema:

https: // github.com / UB-Mannheim / tesseract / settimana



Passaggio 2: eseguire il programma di installazione di Tesseract

Visitare il ' Download ” directory in cui viene scaricato il programma di installazione di Tesseract. Per installare Tesseract su Windows, eseguire il programma di installazione di Tesseract facendo doppio clic su di esso:

Passaggio 3: seleziona la lingua

Molte lingue sono supportate dal programma di installazione di Tesseract. Per interagire con l'interfaccia utente del programma di installazione, scegli “ inglese ” come lingua e fare clic su “ OK ”:

Passaggio 4: installare Tesseract

Dopo aver fatto ciò, sullo schermo apparirà la procedura guidata di configurazione di Tesseract OCR. Per iniziare l'installazione di Tesseract, premi il pulsante ' Prossimo Pulsante ':

Per accettare il “ Contratto di licenza ', clicca il ' Concordo Pulsante ':

Seleziona il ' Installa per chiunque usi questo computer ” e premere l'opzione “ Prossimo Pulsante ':

Se desideri aggiungere dati di script o includere un'altra lingua, contrassegna le rispettive caselle di controllo e premi ' Prossimo pulsante '. Poiché non desideriamo alcuno script di dati o linguaggio aggiuntivo, continueremo con le opzioni selezionate predefinite:

Scegli il percorso di installazione e fai clic su ' Prossimo Pulsante ':

Se non vuoi creare una scorciatoia nel menu Start, seleziona ' Non creare scorciatoie ” e premere il tasto “ Installare Pulsante ':

Successivamente, verrà avviata l'installazione di Tesseract. Attendi fino al completamento dell'installazione e premi ' Prossimo Pulsante ':

Infine, fai clic su ' Fine Pulsante ':

Passaggio 5: imposta la variabile di ambiente

Dopo l'installazione, è necessario impostare la variabile di ambiente del Tesseract. Per farlo, per prima cosa, visita la directory in cui hai installato il Tesseract e copia il percorso da “ Indirizzo ' sbarra:

Effettua una ricerca per “ variabili ambientali ' nel ' Avviare 'menu e apri' Modifica le variabili di ambiente del sistema ”:

All'interno delle impostazioni, vai alla sezione ' Avanzate ” menu di impostazione e fare clic su “ variabili ambientali Pulsante ':

Scegli il ' Sentiero ” Variabile da “ Variabili di sistema ' pannello e premi il ' Modificare Pulsante ':

Dopo di che ' Modifica variabile d'ambiente ” apparirà sullo schermo. Premi il ' Nuovo ” e incolla qui il percorso della directory di installazione di Tesseract copiato. Infine, fai clic su ' OK Pulsante ':

Passaggio 6: verifica l'installazione di Tesseract

Per verificare l'installazione di Tesseract, apri il prompt dei comandi di Windows cercando ' Prompt dei comandi ' nel ' Avviare ' menù:

Dai un'occhiata alla versione di Tesseract usando il comando fornito:

> tesseract --versione

L'output indicato di seguito indica che abbiamo installato con successo la versione di Tesseract ' v5.2.0 ' Su Windows:

Andiamo avanti per verificare come utilizzare Tesseract su Windows.

Come utilizzare Tesseract su Windows?

Il Tesseract viene utilizzato per leggere la scrittura a mano o estrarre il testo dalle immagini. Vediamo come funziona:

Passaggio 1: seleziona Immagine

Seleziona l'immagine da cui vuoi estrarre il testo. Come abbiamo scelto “ 1.png ”:

Passaggio 2: estrai il testo dall'immagine

Una volta aperto il CMD. Utilizza il ' CD ” comando per cambiare la directory in cui è memorizzata l'immagine. Quindi esegui il ' tesseract ' e definire il nome del file immagine come abbiamo specificato ' 1.png ”. Il ' Testo Il parametro ” mostra il nome del file di output:

> CD C:\Utenti\anuma\OneDrive\Immagini\Immagini salvate
> tesseract 1 .png 'Testo'

Passaggio 3: verifica l'estrazione del testo

Per verificare l'estrazione del testo, navigare nella directory in cui esiste il file immagine. Puoi vedere che il file di output ' Testo ” viene salvato anche qui. Fare doppio clic sul file di output per verificare se il tesseract ha estratto il testo dall'immagine o meno:

Puoi vedere che abbiamo estratto con successo il testo usando lo strumento da riga di comando Tesseract:

Abbiamo dimostrato la tecnica per installare e utilizzare Tesseract su Windows.

Conclusione

Per installare Tesseract su Windows, è necessario scaricare il programma di installazione di Tesseract. A tal fine, segui la prima sessione di questo articolo. Quindi imposta la variabile di ambiente Path per utilizzare e accedere a Tesseract dal prompt dei comandi di Windows. Quindi, seleziona il file immagine e usa ' Tesseract comando ” per riconoscere ed estrarre il testo dall'immagine. Qui, hai imparato a installare e utilizzare il ' Tesseract ' Su Windows.