23 Abr 2010 @ 11:26 PM 

Bueno hoy quiero comentar mi experiencia con una tecnología un tanto vieja llamada Text To Speech (TTS) o la conversión de texto a voz que en la actualidad ha mejorado bastante.

Quiero comenzar que yo la uso hace mucho tiempo; todo comenzó con mi perdida de interés a la lectura de libros; a menos que estos sean muy interesantes de los cuales hay muy pocos en este mundo, si en este mundo no me he equivocado.

Como soy un apasionado informático comencé a leer libros digitales sean estos en formato Word, PDF, Ebooks, artículos y noticias en el Internet; comencé sin querer a armar toda una base de datos de buenas lecturas entre manuales y artículos en mi computadora; pero como todo tiene su contra; esta nueva forma de lectura no era para menos, se cansan los ojos al estar mucho tiempo enfrente de la pantalla del computador incluso si es LCD de una Laptop.

Así que armado con “San google” como yo le digo y mi maquina comencé a ver qué alternativas tenia, comencé con algo que ya tenía en mi mente cuando en mi primer computador un PS/1 de IBM que me compro mi madre en el año 1994; vino con la tarjeta “Sound Blaster 16” y una serie de programas multimedia; incluidos en los instaladores me tope con “Talk” que corría en D.O.S donde yo podía escribir cualquier texto en ingles y él lo pronunciaba muy rudimentariamente, lo fantástico de esta tecnología era que a punta de algoritmos informáticos complejos la computadora podía pronunciar palabras y oraciones completas; no eran palabras o silabas pre grabadas en audio de onda (WAV), era increíble para mí.

Así que como indique, con “google” encontré que estas tecnología han evolucionado bastante, comencé con unos motores TTS de Microsoft que por medio de programación podía usar los ayudantes de office y hacerlos hablar; pero lo importante de esta búsqueda fue toparme con un TTS de lo mejor hecho por AT&T llamado “AT&T Labs Natural Voices® Text-to-Speech” en esta página bastante vieja: http://www.funcaragol.org/html/fitecsvb.htm

Y ¿por qué menciono esta página?, pues todos estos motores dejaban mucho que desear con la calidad de la pronunciación, suenan como robots, excepto uno TTS, en particular el AT&T tenía una calidad de pronunciación casi perfecta del idioma en Ingles, ahí no termino mi búsqueda porque encontré que también habían creado voces en español y otros idiomas, las más conocidas llamadas “TTS  Alberto y Rosa”, una voz en español de mujer y otra de hombre. Para que ustedes hagan una prueba les recomiendo esta dirección, la de “Rosa” es lo mejor: http://www2.research.att.com/~ttsweb/tts/demo.php, cada voz del instalador ocupa 1 CD completo de 700MB.

Para la actualidad ya disponemos de otras alternativas, así mismo de buena calidad como el “TTS DIGALO” muy utilizado en videos de “youtube” y en varios idiomas.

Ok ,hasta aquí el lector ya sabe que se puede convertir el texto digital a voz a través de estos motores informáticos; para relacionarlo con el titulo debemos complementarlo con otro software llamado TextAloud de la empresa NextUp, que lo pueden descargar de http://www.nextuptech.com/

Este software es increíble, porque nos permite escribir o pegar algún texto en su interfaz y hacer que lea el texto con algún TTS que tengamos instalado como los de AT&T; pero esto no es lo mejor; sino que dispone de una opción para convertir rápidamente cualquier texto a un archivo MP3 con la voz del TTS que seleccionemos.

Entonces para concluir, ¿que hago yo con todo esto?; pues bien, como mencione al inicio que dispongo de muchos libros digitales entre manuales y otros, yo los estudio de una manera original, copio todo el libro al software “TextAloud” y selecciono la voz de rosa de AT&T y en menos de 1 minuto me devuelve un archivo mp3 con toda la pronunciación, posteriormente cojo este archivo mp3 y lo escucho en el computador, IPOD, PSP o cualquier reproductor de MP3 portable, hasta lo podría grabar en CD de audio y escucharlo en el equipo de sonido o un “DISCMAN”, lo uso para estudiar, incluso tengo las voces en Ingles y sirve pada aprender pronunciación de este idioma, debo aclarar que las voces no son perfectas aun; pero se ha logrado bastante, yo diría que en 90% es buena pronunciación.

Puedes tener un preámbulo en la opcion «Escucha este post», como ejemplo de lo que escribo, pero te invito a probar las de AT&T o Digalo.

Posted By: Lambert Sarango Yamil Edinson
Last Edit: 19 Ene 2013 @ 09:18 PM

EmailPermalinkComments (2)
Tags

 Last 50 Posts
 Back
Change Theme...
  • Users » 11181
  • Posts/Pages » 148
  • Comments » 238
Change Theme...
  • VoidVoid « Default
  • LifeLife
  • EarthEarth
  • WindWind
  • WaterWater
  • FireFire
  • LightLight

Acerca de Yamil Lambert



    No Child Pages.