OCR cos'è questa tecnologia e come può aiutarci
La tecnologia OCR per il riconoscimento dei caratteri e testi è cruciale per moltissime applicazioni. Da quelle più avanzate relative alla visione artificiale a quelle di uso comune.
Esatto, questa tecnologia è molto poliedrica e può aiutare in tantissimi ambiti, industriali e d’ufficio. Scopriamola meglio.
Cos’è esattamente la tecnologia OCR?
OCR è l’acronimo di Optical Character Recognition, ossia riconoscimento ottico dei caratteri. Questa tecnologia è stata sviluppata per applicazioni industriali come il controllo di etichette e codici a barre ed è stata poi convertita all’uso “personale”, in ambito ufficio o scolastico. I software OCR sono applicativi in grado di rilevare dei caratteri presenti all’interno di un documento e convertirli in un testo digitale leggibile da una macchina.
Scopriamone un pò di storia:
Quando nasce OCR
Tecnologia innovativa e per certi versi futuristica, affonda le sue radici nel passato. I primi esperimenti su questo tipo di tecnologia risalgono infatti al 1912.
É in quell’anno che il fisico E. E. Fournier d’Albe costruisce una macchina innovativa, denominata optofono. Questa antidiluviana versione di OCR converte caratteri stampati in nero in un suono, in un primo tentativo d’inclusione per i non vedenti.
Solo il primo passo di una tecnologia in continua evoluzione, che con la scoperta del selenio vedrà il proliferare di queste tecnologie, sempre con il lodevole scopo di aiutare i non vedenti.
L’evoluzione sarà poi continua ed avverrà per tentativi e prove, fino a quando non entreranno in ballo il governo federale statunitense ed un esigenza sempre più pressante, quella di automatizzare e velocizzare il servizio postale.
1965, industrializzazione degli OCR
Tante lettere e missive da smistare e troppo poco tempo per farlo in modalità “umana”. Questa la ragione dello sviluppo degli OCR, che nella versione per il servizio postale, si occupano di rilevare l’equivalente del nostro Codice di Avviamento Postale e convertirlo in un codice stampato rilevabile da tutte le macchine dedicate al ciclo dello smistamento postale.
80 anni dopo, perché puntare ancora su questa tecnologia?
Oggi l’OCR è alla base di molti sistemi di visione artificiale sviluppati per il controllo delle etichette. I sistemi automatici devono infatti poter leggere i barcode, le date di scadenza, le informazioni di lotto e molti altri importanti dati alfanumerici. L’OCR assume quindi una doppia valenza:
- sistema di lettura per individuazione e selezione automatica;
- sistema di lettura per la verifica dell’effettiva leggibilità da parte di un essere umano.
Come funziona la tecnologia OCR?
Alla base dell’OCR c’è l’abilità e possibilità di leggere in maniera corretta l’immagine. Ecco quindi che l’immagine deve essere nitida e ben illuminata, visto che il contrasto tra lo sfondo e caratteri stampati deve essere massimo.
Ecco quindi che in fase di importazione la geometria dell’illuminante e l’intensità dello stesso sono fondamentali. A questi due parametri si aggiunge la risoluzione dell’immagine al momento dello scatto.
Partendo infatti da un immagine “buona” avremo molte più possibilità di ricavarne un testo perfetto.
A scatto avvenuto sarà poi il software a rilevare ed a tradurre un insieme di segni neri in un sensato ordine di lettere e numeri.
Come funziona il software di rilevamento? Come fa a riconoscere testo?
I sistemi OCR funzionano con un sistema molto semplice, quello dell’addestramento. Ogni software con funzioni di OCR viene allenato tramite degli esempi di immagini contenenti testo, la difficoltà del testo sottoposto al software è incrementale ed il feedback al software è immediato e “motivato”.
Ciò permette al software stesso di “partire” con una buona base di dati che viene integrata dai feedback e dalle valutazioni degli utenti.
I software più avanzati riescono poi a capire anche i contorni del testo, delle righe e dell’area scritta; questo permette di trasportare anche la formattazione pagina oltre al testo su un file editabile.
OCR sullo stampatello
Questa è la sfida più facile per i software OCR che ormai riescono a raggiungere al 100% quanto viene scritto. Questa precisione è però riservata agli alfabeti derivati dal latino, in caso di lingue con una radice diversa i problemi rimangono, anche se, le percentuali sono migliorate.
OCR dei testi scritti a mano libera
Vediamo spesso la pubblicità di block-notes o raccoglitori intelligenti che possono andare a digitalizzare quando scritto a mano. Queste soluzioni funzionano relativamente bene, in quanto il software in maniera intelligente mescola il riconoscimento di quanto scritto con l’integrazione di un “dizionario” che permette al software di valutare tra le varie alternative possibili e scegliere la migliore.
Il tutto funziona al meglio quando la scrittura a mano libera è ordinata e le parole ben separate tra loro. Nonostante questo, difficilmente si riesce a superare un tasso di accuratezza del 80/90%. Valore che può andare bene per appunti presi durante una lezione scolastica o una riunione di lavoro, ma non per usi “ufficiali” in cui la precisione diventa fondamentale.
Corsivo
Riconoscere testo scritto in corsivo è la sfida non superata dai software OCR. In questo ambito la ricerca sta ancora procedendo e si segnalano interessanti novità e miglioramenti. Upgrade notevoli, soprattutto quando il software OCR conosce il tipo di testo che si trova davanti.
Estrapolare immagine in testo
Sono molti i software, le app e gli OCR online che propongono questa digitalizzazione avanzata. La ricerca e l’innovazione procedono in maniera costante, visto anche l’interesse a livello industriale e dei clienti finale per questo tipo di prodotto.
Riconoscere testo da un immagine, evidenziarlo ed estrapolarlo trasformando un pdf in testo o immagine in testo è oggi possibile con ottimi risultati. Trasformare in testo editabile un immagine o PDF è semplice ed i risultati in genere sono molto buoni.
Per incrementare le possibilità di riuscita il trucco, come già indicato, è quello di partire da un immagine più definita e nitida possibile.
Come per ogni altro tipo di processo il file iniziale, la sorgente deve essere di ottima qualità se vogliamo un risultato finale valido.
OCR
La soluzione per trasformare immagini e pdf non editabili in testo modificabile esiste. Magari non darà risultati perfetti al primo colpo, ma snellisce comunque il processo di elaborazione di un file. Per un risultato di digitalizzazione ed editing che sembra quasi preso da un film di fantascienza.