OCR pronto all’uso
Esiste un modo per copiare o modificare documenti già stampati? Riscriverli al computer non è sicuramente la soluzione più comoda è veloce. Fortunatamente, in questi casi ci si può servire di un programma OCR (Optical Character Recognition, ossia di riconoscimento ottico dei caratteri). Questi software, in pochi secondi, sono in grado di riconoscere lettere, numeri e punteggiatura presenti in un’immagine e convertirli in formato elettronico modificabile con qualsiasi editor di testi. L’immagine può essere acquisita attraverso uno scanner o realizzata con fotocamere digitali e smartphone, o semplicemente può essere già presente sul PC. Molti ignorano, però, che questa tecnologia è già presente in Microsoft Office e che quindi può essere utilizzata senza acquistare e installare programmi aggiuntivi. In Office 2007, però, la funzione OCR non è attiva di default, ma è possibile farlo in un secondo momento: nel menu Strumenti di Microsoft Office sarà così presente la nuova voce Microsoft Office Document Imaging che consentirà di digitalizzare qualsiasi documento già stampato.
Riconoscimento in lingua
L’OCR non si limita a riconoscere il testo: è anche in grado di correggere eventuali errori utilizzando un dizionario linguistico. Microsoft Office Document Imaging, per impostazione predefinita, ricorre a quello della lingua usata dalle altre applicazioni Office, ma è possibile cambiarlo grazie al menu Strumenti/Opzioni/OCR. In questo modo si possono digitalizzare anche pagine di libri e riviste in inglese, francese, tedesco ecc. Oltre ad importare i documenti direttamente da uno scanner, si possono utilizzare immagini già acquisite in formato TIFF (Tagged Image File Format). Il testo rilevato nel documento potrà poi essere inviato direttamente a Microsoft Word con cui sarà possibile editarlo e salvarlo nel formato desiderato. Nei passi seguenti vedremo appunto come attivare la funzione di riconoscimento del testo in Microsoft Office 2007 e come digitalizzare un documento servendoci di uno scanner collegato al PC.
1 - Da Start/Pannello di controllo/Disinstalla un programma selezioniamo Microsoft Office e clicchiamo sul pulsante Cambia. Andiamo in Strumenti di Office/Microsoft Office Document Imaging/Digitalizzazione, OCR e filtro del servizio di indicizzazione e selezioniamo Esecuzione dal computer locale. Premiamo Continua e completiamo l’installazione del nuovo componente.

2 - Dal menu Strumenti di Microsoft Office avviamo Microsoft Office Document Imaging. Clicchiamo File e selezioniamo Digitalizza nuovo documento. Posizioniamo il foglio sul piano dello scanner, selezioniamo l’impostazione da utilizzare per la scansione (nel nostro caso Bianco e nero da pagina a colori) e premiamo sul pulsante di scansione.

3 - Microsoft Office Document Imaging esegue automaticamente il riconoscimento OCR ogniqualvolta eseguiamo una scansione. Al termine, andiamo in Strumenti e selezioniamo Invia testo a Word. Scegliamo se mantenere o meno le immagini e premiamo OK. Verrà aperta una nuova pagina di Word con il testo pronto per essere modificato e salvato.

Approfondimento:
Con Office 2010 basta OneNote
La funzione di riconoscimento OCR non poteva non essere presente anche in Office 2010. In questo caso, però, il suo utilizzo è un po’ meno immediato. Si deve innanzitutto avviare l’applicazione OneNote e inserire l’immagine di cui si vuole eseguire il riconoscimento OCR (da scanner o una foto digitale). Per essere sicuri che venga effettuato il riconoscimento clicchiamo sull’immagine col tasto destro, andiamo in Consenti la ricerca di testo nell’immagine e scegliamo la lingua da usare. A questo punto, clicchiamo nuovamente col tasto destro sull’immagine e selezioniamo Copia testo dall’immagine. Non resta che avviare Word o un altro editor e incollare il testo. Per copiare solo una parte del documento, basterà scegliere l’opzione Modifica testo alternativo.
Cronologia degli articoli pubblicati su WinTricks
Commenta sul forum
|