5 servicios gratuitos de OCR en línea probados y revisados

¿Tiene un documento PDF(PDF document) o una imagen que le gustaría convertir a texto? Recientemente, alguien me envió un documento por correo que necesitaba editar y devolverlo con las correcciones. La persona no pudo ubicar una copia digital, así que me encomendaron la tarea de poner todo ese texto en formato digital.

No había forma de que pasara horas escribiendo todo de nuevo, así que terminé tomando una buena foto de alta calidad del documento y luego me abrí camino a través de un montón de servicios de OCR en línea para ver cuál me daría la mejor. resultados

En este artículo, revisaré un par de mis sitios favoritos para OCR que son gratuitos. Vale la pena señalar que la mayoría de estos sitios brindan un servicio gratuito básico y luego tienen opciones pagas si desea funciones adicionales como imágenes más grandes, documentos PDF de varias páginas , diferentes idiomas de entrada, etc.

También es bueno saber de antemano que la mayoría de estos servicios no podrán igualar el formato de su documento original. Estos son principalmente para extraer texto y eso es todo. Si necesita que todo esté en un diseño o formato(layout or format) específico , tendrá que hacerlo manualmente una vez que obtenga todo el texto del OCR .

Además, los mejores resultados para obtener el texto vendrán de documentos con una resolución de 200 a 400 DPI(DPI resolution) . Si tiene una imagen de DPI(DPI image) baja , los resultados no serán tan buenos.

Por último, hubo muchos sitios que probé que simplemente no funcionaron(t work) . Si busca OCR en línea gratuito en Google , verá un montón de sitios, pero varios de los 10 primeros resultados ni siquiera completaron la conversión. Algunos expiraban, otros daban errores y algunos simplemente se atascaban en la página de "conversión", así que ni siquiera me molesté en mencionar esos sitios.

Para cada sitio, probé dos documentos para ver qué tan bien sería el resultado. Para mis pruebas, simplemente usé mi iPhone 5S para tomar una foto de ambos documentos y luego los subí directamente a los sitios web para convertirlos.

En caso de que quieras ver cómo se veían las imágenes que usé para mi prueba, las adjunto aquí: Test1 y Test2 . Tenga en cuenta que estas no son las versiones de resolución completa de las imágenes tomadas desde el teléfono. Usé la imagen de resolución(resolution image) completa al subir a los sitios.

OCR en línea

OnlineOCR.net es un sitio limpio y simple que entregó muy buenos resultados en mi prueba. Lo principal que me gusta de él es que no tiene toneladas de anuncios por todas partes, lo que suele ser el caso con este tipo de sitios de servicios de nicho(niche service) .

ocr en línea gratis

Para comenzar, seleccione su archivo y espere hasta(file and wait till) que termine de cargarse. El tamaño máximo de carga para este sitio es de 100 MB. Si se registra para obtener una cuenta gratuita, obtiene algunas funciones adicionales, como un tamaño de carga más grande, archivos PDF(PDFs) de varias páginas , diferentes idiomas de entrada, más conversiones por hora, etc.

A continuación, elija su idioma de entrada(input language) y luego elija el formato de salida(output format) . Puede elegir entre Word , Excel o Texto sin(Plain Text) formato . Haga clic(Click) en el botón Convertir(Convert) y verá el texto que se muestra en la parte inferior de un cuadro junto con un enlace de descarga(download link) .

salida ocr

Si todo lo que desea es el texto, simplemente cópielo y péguelo(copy and paste) desde el cuadro. Sin embargo, le sugiero que descargue el documento de Word(Word document) porque hace un trabajo sorprendentemente bueno al mantener el diseño del documento original.

Por ejemplo, cuando abrí el documento de Word(Word document) para mi segunda prueba, me sorprendió encontrar que el documento incluía una tabla con tres columnas, tal como en la imagen.

salida ocr en línea

De todos los sitios, este fue el mejor con diferencia. Vale la pena registrarse si necesita hacer muchas conversiones.

Para completar, también voy a vincular los archivos de salida creados por cada servicio para que pueda ver los resultados por sí mismo. Estos son los resultados de OnlineOCR : Test1 Doc y Test2 Doc(Test1 Doc and Test2 Doc) .

Tenga en cuenta que al abrir estos documentos de Word en su computadora, recibirá un mensaje en Word que indica que es de Internet y(Internet and editing) que se ha deshabilitado la edición. Eso está perfectamente bien porque Word no(Word doesn) confía en los documentos de Internet y realmente no tiene que habilitar la edición si solo desea ver el documento.

i2OCR

Otro sitio que dio bastante buenos resultados fue i2OCR . El proceso es muy similar: elija su idioma, archivo y luego presione Extraer texto(Extract Text) .

i2ocr

Tendrás que esperar uno o dos minutos aquí porque este sitio tarda un poco más. Además, en el Paso 2(Step 2) , asegúrese de que su imagen se muestre con el lado derecho hacia arriba en la vista previa; de lo contrario, obtendrá un montón de galimatías como salida. Por alguna razón, las imágenes de mi iPhone se mostraban en modo vertical(portrait mode) en mi computadora, pero en modo horizontal cuando las subí a este sitio.

salida i2ocr

Tuve que abrir manualmente la imagen en una aplicación de edición de fotos, girarla 90 grados, luego girarla de nuevo a la posición vertical y luego guardarla de nuevo. Una vez(Once) completado, desplácese hacia abajo y le mostrará una vista previa del texto junto con un botón de descarga(download button) .

A este sitio le fue bastante bien con el resultado de la primera prueba, pero no le fue tan bien con la segunda prueba que tenía el diseño de columnas(column layout) . Estos son los resultados de i2OCR: Test1 Doc y Test2 Doc(Test1 Doc and Test2 Doc) .

GratisOCR

Free-OCR.com tomará sus imágenes y las convertirá en texto sin formato(plain text) . No tiene una opción para exportar a formato Word(Word format) . Elija su archivo, seleccione un idioma y luego haga clic en Inicio(Start) .

El sitio es rápido y obtendrá el resultado con bastante rapidez. Simplemente haga clic(Just click) en el enlace para descargar el archivo de texto(text file) a su computadora.

libreocr

Al igual que con NewOCR mencionado a continuación, este sitio escribe en mayúscula todas las T en el documento. No tengo idea de por qué haría eso, pero por alguna extraña razón este sitio y NewOCR(site and NewOCR) hicieron esto. No es un gran problema cambiarlo, pero es un proceso tedioso que realmente no debería tener que hacer.

Estos son los resultados de FreeOCR : Test1 Doc y Test2 Doc(Test1 Doc and Test2 Doc) .

ABBYY FineReader en línea

Para usar FineReader Online , debe registrarse para obtener una cuenta, que le otorga una prueba gratuita de 15 días para OCR de hasta 10 páginas de forma gratuita. Si solo necesita hacer un OCR de una sola vez para un par de páginas, entonces puede usar este servicio. Asegúrese(Make) de hacer clic en el enlace de verificación(verify link) en el correo electrónico de confirmación(confirmation email) después de registrarse.

buen lector en línea

Haga clic en Reconocer(Recognize) en la parte superior y luego haga clic en Cargar(Upload) para seleccionar su archivo. Elija su idioma, formato de salida y luego haga clic en Reconocer(Recognize) en la parte inferior. Este sitio tiene una interfaz limpia y tampoco anuncios.

En mis pruebas, este sitio pudo capturar el texto del primer documento de prueba(test document) , pero fue absolutamente enorme cuando abrí el documento de Word(Word doc) , así que terminé haciéndolo de nuevo y eligiendo Texto(Plain Text) sin formato como formato de salida(output format) .

Para la segunda prueba con las columnas, el documento de Word(Word document) estaba vacío y ni siquiera pude encontrar el texto. No estoy seguro de lo que sucedió allí, pero no parece poder manejar nada más que párrafos simples. Estos son los resultados de FineReader : Test1 Doc y Test2 Doc.

NuevoOCR

El siguiente sitio, NewOCR.com , estuvo bien, pero no tan bueno como el primer sitio. En primer lugar, tiene anuncios, pero afortunadamente no muchos. Primero selecciona su archivo y luego hace clic en el botón Vista previa(Preview) .

cargar imagen

A continuación, puede rotar la imagen y ajustar el área donde desea buscar texto. Es bastante parecido a cómo funciona el proceso de escaneo(scanning process) en una computadora con un escáner adjunto.

imagen ocr

Si el documento tiene varias columnas, puede marcar el botón Análisis de diseño de página( Page layout analysis) e intentará dividir el texto en columnas. Haga clic(Click) en el botón OCR(OCR button) , espere unos segundos hasta que se complete y luego desplácese hacia abajo cuando la página se actualice.

En la primera prueba, obtuvo todo el texto correctamente, ¡pero por alguna razón puso en mayúscula cada T en el documento! No tengo idea de por qué haría eso, pero lo hizo. En la segunda prueba con el análisis de página(page analysis) habilitado, obtuvo la mayor parte del texto, pero el diseño estaba completamente mal.

Estos son los resultados de NewOCR : Test1 Doc y Test2 Doc.

Conclusión

Como puedes ver, lo gratuito no te da muy buenos resultados la mayor parte del tiempo, lamentablemente. El primer sitio mencionado es el mejor con diferencia porque no solo hizo un gran trabajo al reconocer todo el texto, sino que también logró conservar el formato del documento original.

Sin embargo, si solo necesita texto, la mayoría de los sitios web anteriores deberían poder hacerlo por usted. Si tiene alguna pregunta, no dude en comentar. ¡Disfrutar!



About the author

Soy técnico informático profesional y tengo más de 10 años de experiencia en el campo. Me especializo en el desarrollo de Windows 7 y Windows Apps, así como en el diseño de Cool Websites. Tengo un gran conocimiento y experiencia en el campo, y sería un activo valioso para cualquier organización que busque hacer crecer su negocio.



Related posts