Es decir que los archivos PDF o de imagen subidos (o arrastrados directamente) se utilizan para extraer partes de texto, que se convierten en un documento de Google Docs.
Para una eficiente extracción, los archivos PDF o de imagen deben cumplir los siguientes requisitos:
- Resolución: Los archivos de alta resolución dan mejores resultados.
- Orientación: solo se reconocen documentos con texto en horizontal de izquierda a derecha. Si tienes un documento en otra orientación, puedes usar cualquier programa que permita manipular imágenes para girarlas antes de subirlas a Google Docs.
- Idiomas, fuentes y grupos de caracteres: en estos días se ha ampliado la lista a 33 idiomas incluyendo el español. Las fuentes habituales como Arial y Times New Roman son las que mejor funcionan.
- Calidad de imagen: las imágenes nítidas con luz uniforme y contrastes claros funcionan mejor.
El tamaño máximo de los archivos de imagen o PDF es de 2 Mb y como sucede en la mayoría de los casos de reconocimiento de textos, habrá que efectuar correcciones a mano.