Tag

, ,

Google’s web-based document editor – Google DOCS – can now convert the text inside your PDFs and images into text you can edit. When you upload a file to Google Docs, you’ll see the option to “Convert text from PDF or image files to Google Docs documents.” You can upload any PDF, PNG, JPG or GIF. To do the conversion, Google is relying on a technology commonly known as Optical Character Recognition, or OCR. The outcome does not seem not perfect, and the results will vary based on the resolution or visual clarity of whatever the user is uploading. There are some uncognizied fonts or images, so one has to sort out a solution. In a sense, the cleaner the layout and the text rendering are, the cleaner is the result. Images are a little iffy. Of course, the higher resolution and the more well-lit your image, the better the results. And you can upload just about any high res image or long PDF, since Google Docs’ file size cap for these file types is a generous 1024MB. Note that 1024MB is also the storage limit for a free Google Docs account.

In Italiano:

Google Docs ha attivato da qualche giorno una nuova funzione che converte PDF e immagini OCR generate da scanner in documenti di testo. L’opzione “Convert text from PDF or image files to Google Docs documents” compare ogni volta che si carica un file sulla piattaforma online.

Questi non possono superare i 10 MB e la risoluzione deve essere inferiore ai 25 megapixel. Durante la conversione dei documenti le formattazioni potrebbero non essere rispettate. Al momento le lingue supportate sono Inglese, Francese, Italiano, Tedesco e Spagnolo. L’integrazione della tecnologia OCR in Google Docs è in sperimentazione da anni ma soltanto ora è pienamente funzionante e accessibile a tutti gli utenti. Ovviamente la correttezza della conversione dipende dalla qualità del file caricato: con risoluzioni più basse aumenta la possibilità di errore.