Gran parte delle fonti mondiali provengono da libri, riviste, giornali e documenti storici e quindi sono su carta stampata e, a volte, difficili da reperire o comunque non accessibili a tutti.

In parte il problema può essere risolto grazie alla scansione e quindi trasferendo i dati dal supporto cartaceo a quello digitale, ma l’immagine che si ottiene non viene riconosciuta come testo dal computer.
Google ha risolto il problema grazie alla tecnologia OCR (Optical Character Recognition) che permette il riconoscimento ottico dei caratteri e quindi trasforma le immagini di un testo in un testo per il computer che può essere modificato, indicizzato e cercato.
La tecnologia OCR è integrata in Google Drive e, di recente, è disponibile in ben 200 lingue diverse e in 25 differenti sistemi di scrittura. Per eseguirla bastano due semplici passaggi:
- caricare un documento nel formato attuale (ad esempio un pdf o un’immagine);
- fare clic sul documento nell’interfaccia di Drive e selezionare Apri con>Google Documenti.
Si aprirà quindi un documento Google con l’immagine originale seguita dal testo estratto e non sarà nemmeno necessario dover specificare in che lingua è scritto il documento. La procedura funziona sia da desktop che da dispositivo mobile, grazie all’applicazione Android di Google Drive.