Natural Sounding Text to Speech?

76

Estoy buscando un software de texto a voz fácil de instalar para Ubuntu que suene natural. He instalado Festival , Gespeaker , etc., pero nada suena muy natural. Todo muy sintético y difícil de entender.

¿Alguna recomendación por ahí?

    
pregunta I Heart Ubuntu 20.07.2011 - 17:36

13 respuestas

18

Creo que he encontrado el mejor software TTS de forma gratuita con una extensión de Google Chrome llamada "SpeakIt". Esto solo funciona en el navegador Chrome para mí en Ubuntu. No funciona con Chromium por alguna razón. SpeakIt viene con dos voces femeninas que suenan muy realistas en comparación con todo lo demás. Hay al menos cuatro hombres más y amp; las voces femeninas enumeran las extensiones de Chrome si buscas en Chrome Web Store usando "TTS" como tu consulta.

enlace

Para usar en un sitio web. resaltas el texto que deseas que se lea y haces clic derecho y "SpeakIt" o haces clic en el icono de SpeakIt acoplado en la barra superior de Chrome.

Los usuarios de Firefox también tienen dos opciones. Dentro de los complementos de Firefox, realice una búsqueda de TTS y encontrará "Haga clic en Hablar" y también "Texto a voz". Las voces no son tan buenas como las voces de Chrome SpeakIt, pero definitivamente son utilizables.

La extensión SpeakIt usa tecnología iSpeech y por un precio de $ 20 al año, el sitio puede convertir archivos de texto a audio MP3. Puede ingresar texto, URL, fuentes RSS, así como documentos como TXT, DOC y PDF y enviarlos a MP3. Puede hacer podcasts, incrustar audio, etc. Aquí hay un enlace ...

enlace

y una muestra de su audio (no sé cuánto durará el enlace) ...

enlace

    
respondido por el I Heart Ubuntu 27.01.2013 - 00:11
45

SVOX pico2wave

Además de las otras respuestas:

Un TTS muy minimalista, un sonido mejor que el espeak o mbrola (en mi opinión).

Alguna información:
enlace

No entiendo por qué pico2wave es, en comparación con el espeak o mbrola, raramente discutido. Es pequeño, pero suena realmente bien (natural). Sin modificaciones, oirás una voz femenina que suena natural.

¡Y ... en comparación con Mbrola, reconoce las Unidades y lo dice de la manera correcta!
Por ejemplo:

  • 2 ° C → dos grados
  • 2 m → dos metros
  • 2 kg → dos kilogramos

Después de la instalación, la utilizo en un script:

#!/bin/bash
pico2wave -l=de-DE -w=/tmp/test.wav ""
aplay /tmp/test.wav
rm /tmp/test.wav

Luego ejecútelo con el texto deseado:

<scriptname>.sh "hello world"

o lea el contenido de un archivo completo:

<scriptname>.sh "$(cat <filename>)"

Eso es todo para tener un TTS de trabajo ligero y estable en Ubuntu.

    
respondido por el user85321 24.08.2012 - 15:12
11

Simple Google ™ TTS

Debido a la falta de una mejor alternativa, escribí un script bash que interactúa con una secuencia de comandos perl de Michal Fapso para proporcionar TTS a través del Traductor de Google. De la descripción del proyecto:

  

La intención es proporcionar una interfaz fácil de usar para la salida de texto a voz a través del sistema de síntesis de voz de Google. Una opción alternativa que utiliza pico2wave proporciona automáticamente la síntesis TTS en caso de que no se encuentre una conexión a Internet.

     

Tal como está, el envoltorio admite la lectura desde entrada estándar, archivos de texto plano y la selección X (texto resaltado).

Las principales características son:

  • Síntesis de TTS en línea a través de Google translate
  • síntesis de TTS fuera de línea a través de pico2wave
  • admite una variedad de idiomas diferentes
  • puede leer de CLI, archivos de texto y texto resaltado
  • admite la lectura de texto resaltado con formato fijo (por ejemplo, archivos PDF)

La instalación y el uso están documentados en la página del proyecto .

Me alegraría si lo intentaras. ¡Se aceptan informes de errores y cualquier otro comentario !

    
respondido por el Glutanimate 23.08.2014 - 19:18
8

He visto alto y bajo para texto a voz para Ubuntu que es de alta calidad. No hay ninguno. Mis cuerdas vocales están paralizadas, así que necesitaba TTS para agregar instrucciones de voz a mis videos de Ubuntu . Puede obtener un software comercial de texto a voz de alta calidad aquí: enlace Es realmente muy caro. Terminé comprando Natural Reader para Windows (no funciona en Ubuntu en Wine) por $ 40. Tal vez más tarde obtenga el de Linux.

Espero que eso ayude.

    
respondido por el Joe Steiger 20.07.2011 - 17:57
6

He estado investigando sobre el mejor sonido y las voces de texto a voz más fáciles de sintonizar. A continuación se muestra una lista de lo que pensé que eran los 5 mejores productos en orden de calidad de sonido. La mayoría de los sitios web asociados con estos productos tienen una demostración interactiva que le permitirá tomar su propia determinación.

  1. NeoSpeech
  2. iVona
  3. Acapela
  4. AT & amp; T voces naturales
  5. Voces de CereProc
respondido por el Jim 24.04.2012 - 15:35
6

Pico y espeak son divertidos y fáciles de poner en práctica, pero no son tan buenos. Las voces predeterminadas de Festival tampoco son tan buenas. Sin embargo, Festival es un marco de discurso basado en esquemas, donde varios investigadores han creado voces de plug-in mucho mejores. Puede superar fácilmente la calidad pico2wave en stock Ubuntu, porque una de esas voces está disponible como un paquete listo para usar.

Para que el Festival suene natural, esto es lo que debe hacer:

sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

Puedes hacerlo desde la línea de comando usando -b (o --batch ) y poniendo cada comando en comillas simples:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

Puede obtener otras voces bastante buenas del repositorio de Nitech, pero instalarlas es complejo, y las rutas predeterminadas cambiaron, por lo que las referencias de nombre de archivo en los archivos del esquema incluido pueden necesitar ser editadas manualmente para trabajar en stock Ubuntu.

    
respondido por el Jon Watte 25.04.2017 - 19:31
5

Combina herramientas SVOX (pico) con LibreOffice:

Las herramientas SVOX (pico) son fáciles de instalar y ofrecen voces de buena calidad en Ubuntu. Instalarlo:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Puede usar LibreOffice en combinación con herramientas SVOX (pico) instalando la extensión "Leer texto" y obtienes una "GUI" para este excelente software TTS:

Configure las opciones de la Extensión de lectura de texto con Herramientas - Complementos - Selección de lectura. ... Use / usr / bin / python como el programa externo. Seleccione una opción de línea de comando que incluya el token (PICO_READ_TEXT_PY) , es posible que desee experimentar algunos de ellos.

Ahora solo tiene que seleccionar un texto en LO Writer, Calc, Impress o Draw y hacer clic en el icono agregado como barra de herramientas (una cara feliz con un globo).

    
respondido por el leoperbo 15.12.2013 - 00:48
4

Encuentro que las voces de Nitech HTS en el festival son muy naturales y reconfortantes sobre cualquier otra voz que haya escuchado. Vea este enlace sobre cómo configurar Nitech y otros sonidos en el festival. No he encontrado una buena interfaz gráfica de usuario que pueda usar para configurar esas voces, pero configurarlas a través de festival.scm todavía funciona. Esa publicación es muy antigua y es posible que desee encontrar el directorio de instalación real usando comando "localizar festival"

    
respondido por el razor 09.11.2011 - 13:56
4

Esto es lo que hice para tener habla natural pura para el pdf y otros archivos de texto (otras soluciones no son naturales o simplemente son servicios pagados). En realidad, se trata de evitar el uso de cromo o cromo, pero funciona de manera rápida y sencilla.

  1. Instala la extensión SpeakIt! en tu cromo o cromo.
  2. Instala PDF Viewer si usas cromo (Chrome ya tiene un pdf visor de forma gratuita) y marque las opciones "Permitir en incógnito" y "Permitir el acceso a las URL de archivo" en la configuración de extensiones de cromo.
  3. Arrastra y suelta tu pdf al navegador.
  4. ¡Ahora resalta un texto y haz clic derecho y selecciona SpeakIt! para que pueda escuchar el text-to-speech puro y natural.

También hay formas de abrir otros archivos como .doc y .txt en Chrome y hacer lo mismo. Hay otras extensiones para Chrome que ven archivos PDF, verifique si le quedan mejor. ¡Además puedes subir todo tipo de textos en Google Drive y usar SpeakIt! para leerlo por ti Otra extensión llamada 'Speak text' funciona de la misma manera y tiene un habla natural.

    
respondido por el Pooya Sanooei 12.12.2013 - 01:54
2

al buscar un mejor motor tts para usar con el nuevo modo narrativo Firefox 49 encontré pico tts (svox) - mi motor TTS favorito.

sudo apt install espeak libttspico0 libttspico-data libttspico-utils

¿Cómo cambiar el sistema del motor de síntesis de voz por defecto?

Las personas de arch linux me llevaron al camino correcto ( enlace ):

Descomenta el módulo que te gusta y configúralo como predeterminado en la configuración del hablante-despachador:

#> vim /etc/speech-dispatcher/speechd.conf

[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak"       "sd_espeak"   "espeak.conf"
AddModule "pico-generic"  "sd_generic"   "pico-generic.conf"

[...]
#DefaultModule espeak
DefaultModule pico-generic

Reinicia el daemon:

#> sudo systemctl restart speech-dispatcher.service

PERO, al volver a iniciar Firefox, no pasa nada. De acuerdo con el enlace de arriba (post del foro de arco # 10 y # 16) funciona con festival (no lo intenté), pero el despachador de voz para pico no enumera las voces disponibles. No se ejecutará.

Cualquier idea por ahí sería muy apreciada; -)

    
respondido por el apos 14.11.2016 - 22:55
1

Mi programa favorito de texto a voz se llama Magic English, pero como Natural Reader mencionado por Joe Steiger, es un programa de Windows y no estoy seguro de si se ejecutará en Wine.

AT & amp; T Natural Voices está disponible en línea como demostración, pero eso es más un trabajo alrededor de una solución ...

    
respondido por el Chris Granger 20.07.2011 - 19:10
0

Para eso construyo Speaker inteligente - extensión para Google Chrome. Puede leer páginas incluso sin selección (cuando la detención del texto es correcta).

    
respondido por el Vitaly Zdanevich 16.09.2017 - 18:02
0

Google TTS

Pico, mbrola, cmu, festival, flite, todo SUCK en 2017 (Fueron increíbles en los 90). El discurso natural AT & amp; T (que es fantástico) no es compatible con Linux y no es gratuito, por lo tanto, utilizamos Google

git clone https://github.com/Glutanimate/simple-google-tts.git
sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-perl libwww-mechanize-perl libhtml-tree-perl so$
cd simple-google-tts
sudo ln -s 'pwd'/simple_google_tts /usr/local/bin
simple_google_tts en "Text to speech is now installed"
cd -
    
respondido por el Jonathan 29.11.2017 - 05:32

Lea otras preguntas en las etiquetas