¿Cómo puedo extraer texto de imágenes?

21

¿Cómo puedo extraer texto de imágenes?

No estoy hablando de archivos escaneados, sino de imágenes de variedades de jardín, como cuando se toma una foto de alta definición de una pizarra en clase, y está muy bien escrita a mano; o cuando fotografía una página de un libro de recetas y quiere la receta en formato de texto.

¿Algún software libre y abierto para eso?

Intenté tesseract, y los resultados fueron terribles.

    
pregunta Strapakowsky 31.08.2011 - 08:33

2 respuestas

24

El acto de extraer texto de imágenes se llama OCR y Ubuntu tiene una página wiki dedicada a OCR . Desde esa página:

Herramientas de OCR disponibles

Los repositorios de Ubuntu Universe contienen las siguientes herramientas de OCR:

  1. gocr - Una línea de comando OCR
  2. fuzzyocr - complemento spamassassin para comprobar los archivos adjuntos de imágenes
  3. libhocr0 - OCR en hebreo
  4. ocrad - Programa de reconocimiento óptico de caracteres
  5. ocrfeeder - Análisis del diseño del documento y sistema de reconocimiento óptico de caracteres
  6. ocropus : análisis de documentos y sistema de OCR
  7. tesseract-ocr

Los repositorios multiverso de Ubuntu también contienen:

  1. cuneiforme : sistema OCR multilingüe

Algunos paquetes están desactualizados, pero se pueden encontrar otros nuevos no oficiales en Alex_P PPA (código de adición de PPA) : ppa: alex-p / notesalexp). Si nunca usó un PPA, consulte cómo agregar software desde un PPA .

editar: Como se muestra en el comentario, Clara OCR existe también, pero se le ocurrió algo a Hardy y su sitio web tiene 2009 como última actualización.

    
respondido por el Rinzwind 31.08.2011 - 08:55
14

tesseract-ocr sería el mejor en comparación con todos los demás. Para la instalación, ejecute el comando sudo apt-get install tesseract-ocr .

El uso es tesseract filename.jpg output.txt .

El comando anterior generará output.txt .

Puede considerar seleccionar el idioma apropiado. En ese caso, deberá instalar el paquete tesseract-ocr-LANG , donde LANG es el código de tres letras ISO 639-2. En este momento tiene 108 idiomas en 16.04 repo. Luego, use tesseract filename.jpg output -l LANG .

    
respondido por el Sudhir Belagali 18.04.2016 - 03:44

Lea otras preguntas en las etiquetas