OCR gratuito con Google Docs
Con Google Docs si può accedere da una funzione OCR sperimentale che permette di effettuare l’estrazione del testo da un documento di tipo immagine.
Google ci ha abituati a vedere la definizione Beta accompagnare i suoi prodotti per periodi veramente notevoli: facilmente si tratta di 2 o 3 anni (un esempio per tutti GMail).
In questo caso però -lo diciamo subito- si tratta di qualcosa che sta ancora prima del livello di Beta, ma di una funzione sperimentale che al momento non è ancora dato di sapere se raccoglie effettivamente l’interesse della grande G. In altre parole non è chiaro se il progetto avrà uno sviluppo o meno.
Si tratta della possibilità di estrarre il testo da immagini grazie ad un servizio OCR online che si collega a Google Documents.
Premesso quindi che occorre avere un account valido per Google Docs, ci si collega alla pagina dimostrativa della funzione OCR.
Si seleziona poi il file da sottoporre alla scansione, che può essere di tipo JPG, GIF, o PNG (ricordo che Acrobat permette di salvare i propri contenuti in questi formati, quindi -con un passaggio in più- è indirettamente supportato anche PDF), tenendo conto delle limitazioni:
l’immagine di partenza deve essere sufficientemente chiara, con testo almeno di corpo 10
la dimensione del file può essere al massimo di 10 MB, sapendo che file vicini alle dimensioni massime potranno richiedere molto tempo per essere trattati (per 2 MB sono previsti circa 40 secondi)
Il risultato è un file, direttamente salvato in Google Docs, che contiene il testo estratto.
Il livello qualitativo è discreto; diciamo che in alcuni casi non si ottiene nessun testo, mentre un file preparato appositamente, con testo chiaro e pulito, dà un’interpretazione corretta la 100%.
Quindi non è uno strumento su cui contare al 100%, ma che si può rivelare molto comodo in tante situazioni.