Hace algunos meses Google Docs incorporó a su servicio la tecnología OCR (reconocimiento óptico de caracteres). El reconocimiento óptico de caracteres te permite extraer texto de imágenes mediante algoritmos informáticos automatizados.

Es decir que los archivos PDF o de imagen subidos (o arrastrados directamente) se utilizan para extraer partes de texto, que se convierten en un documento de Google Docs.

Reconocimiento de caracteres en Google Docs


Para una eficiente extracción, los archivos PDF o de imagen deben cumplir los siguientes requisitos:

  • Resolución: Los archivos de alta resolución dan mejores resultados.
  • Orientación: solo se reconocen documentos con texto en horizontal de izquierda a derecha. Si tienes un documento en otra orientación, puedes usar cualquier programa que permita manipular imágenes para girarlas antes de subirlas a Google Docs.
  • Idiomas, fuentes y grupos de caracteres: en estos días se ha ampliado la lista a 33 idiomas incluyendo el español. Las fuentes habituales como Arial y Times New Roman son las que mejor funcionan.
  • Calidad de imagen: las imágenes nítidas con luz uniforme y contrastes claros funcionan mejor.

El tamaño máximo de los archivos de imagen o PDF es de 2 Mb y como sucede en la mayoría de los casos de reconocimiento de textos, habrá que efectuar correcciones a mano.

 

Déjanos tu comentario, para nosotros es muy importante.
Más abajo encontrarás más recursos gratuitos sobre este tema.
¡Comparte ahora este contenido con tus amigos!