Obtener el conteo de palabras de un documento pdf en Evince

19

¿Hay alguna manera de obtener el conteo de palabras de un documento PDF que estoy viendo en Evince, el lector de pdf predeterminado de Ubuntu? Puedo convertir los documentos en archivos de texto y obtener el conteo de palabras desde la terminal, pero me gustaría poder acceder rápidamente a ellos sin tener que usar la terminal. ¿Hay algún complemento que pueda hacer esto, o ya está incorporado y me lo estoy perdiendo?

P.S. Preferiría no cambiar mi visor ya que Evince es el visor de PDF predeterminado en Ubuntu, y me gustaría hacer todo lo posible con las aplicaciones predeterminadas, ya que muchas de ellas, incluido Evince, son realmente agradables.

    
pregunta Chris Wilson 08.11.2010 - 19:11

4 respuestas

10

Una respuesta de Olaf Leidinger en la lista de correo de Evince:

Creo que tal característica es más adecuada para los editores de documentos, ya que tienen más información sobre el documento como un simple espectador y contar palabras es trivial. Tome un archivo PDF como ejemplo. Lo que ves como texto podría ser algún tipo de de forma gráfica vectorial. Incluso si el texto está contenido como tal en el archivo PDF, esas palabras que ves pueden estar compuestas de múltiples "dibujar texto en posición (y, x) "- comandos - por ejemplo, en caso de diéresis o fin de línea. Entonces, una sola palabra podría contar como palabras múltiples. Por lo tanto, creo que podría ser difícil de implementar tal característica confiablemente. Eche un vistazo a pdftotext para ver a qué me refiero.
    
respondido por el Chris Wilson 10.11.2010 - 11:22
26

Puedes hacerlo a través de la línea de comando:

pdftotext filename.pdf - | tr -d '.' | wc -w
    
respondido por el Sid 08.11.2010 - 19:22
9

¿Qué tal un script bash rápido que requiera zenity y lo indique. Cuando se llama sin un argumento, le dará un cuadro de diálogo para que pueda elegir un archivo. Cuando se le llame con un argumento (o después de dicho cuadro de diálogo), ambos abrirán el archivo para mostrarle un cuadro de diálogo con un conteo de palabras.

En otras palabras, copie lo siguiente en un archivo de texto, llamado evince-word-count.sh o algo, guárdelo en algún lugar de su ruta (por ejemplo, ~/bin/ ), hágalo ejecutable (ya sea a través del botón derecho y propiedades de Nautilus o con chmod +x ~/bin/evince-word-count.sh ),

#!/bin/bash
if [ "$#" -gt "0" ] ; then
    filename=""
else
    filename="$(zenity --file-selection)"
fi
evince "$filename" &
zenity --info --text "This PDF has $(pdftotext "$filename" - | tr -d '.' | wc -w) words"
exit 0

Ahora, haga clic con el botón derecho sobre algunos archivos PDF en nautilus, elija "Abrir con ..." y luego haga que se abra con evince-word-count.sh. Ahora, cuando abre un PDF, se abrirá en ambos casos y le asignará un número de palabras.

    
respondido por el frabjous 08.11.2010 - 22:14
4

No creo que eso sea posible (bueno, es técnicamente posible, pero no se ha implementado).

Debes recordar que Evince es un visor de documentos y el recuento de palabras es una función que se suele necesitar en un editor (sí, sé que este no es siempre el caso ).

Le gustaría ponerse en contacto con los desarrolladores de Evince y preguntar si les interesaría implementar esta función.

    
respondido por el 8128 08.11.2010 - 19:16

Lea otras preguntas en las etiquetas