Hilo oficial sobre los sintetizadores de voz

4106 mensajes, 137 páginas:  1; 117 118119 120 121; 137 ↖ Volver a la lista de temas

Resultado: +40

3541. camello-con-cuello,

hola. ¿alguien sabe por qué en el motor de texto a voz en los teléfonos sangsung la voz de España masculina se ultra traba? pregunto porque antes no hacía eso

Resultado: +0

3542. pianino.64,

hagan lo que yo.
en internet archive busquen el window eyes demo 4.0 o 4.1 creo que era.
ahí trae eloquence con todo cargado

Resultado: +0

3543. gandolfi,

hola alguien tiene la canción te necesito de amaral cantada por jaws?

Resultado: +0

3544. El-Megalovano,

Compañers, sabían que ahora en ElevenLabs puedes compartir voces? Solamente las generativas y no clonadas, los advierto.
Y para los que quieren voces neuronales sin conexión pues los que tengo es esto: gaita.
https://github.com/mush42/piper-nvda

Resultado: +0

3545. amitabh_bachchan ,

cómo es que se hace para usar las voces de este sinte? me lleva a la web y luego me aparece para descargar, pero no sé qué descargar exactamente. alguien que explique mejor el procedimiendo?

Resultado: +0

3546. Delicious_icecream,

yo solo encuentro archivos con extensión .onnx

Resultado: +0

3547. rmcpantoja,

Buenas, El proceso de instalación de las voces en piper es simple:
Una vez instalado, habrá una nueva categoría piper voice manager la cual nos permite administrar estas voces. Se debe seleccionar la opción install voice from local file... y, dentro del explorador, seleccionar el archivo con extensión .tar.gz del paquete. De paso, aprovecho el post para compartir una carpeta con voces en español que he estado haciendo, y si alguien tiene datasets estaré gustoso de entrenarlos: https://drive.google.com/drive/folders/1zFJRTI6CpVw9NkrTiNYOKGga0yn4JXzv?usp=drive_link

Resultado: +0

3548. Delicious_icecream,

lo que decía es que en el repo de github solo aparecen unos archivos con extensión .onnx, no encuentro ningún .tar.gz. Por otro lado, estoy descargando la carpeta que dijiste @rmcpantoja, a ver si funca.

Resultado: +0

3549. Braille_and_Speak2000,

Che rmcpantoja, te pregunto. Son compatibles los datasets utilizados para las voces que entrenan por ahí para los covers, usar con FkeYou y demás o al ser otro sintetizador usa otra IA aparte nada que ver? O habría una forma de imporatr para este sinte los datasets que ya hay por ahí, por ejemplo así leemos con voces de cantantes determinados? Porque supongo que todo el proceso de entrenamiento será similar.
Este sí que fue un gran aportazo, yo ya estaba esperando personalmente voces impulsadas por IA para usar con NVDA. Según como fuere el proceso, quiero entrenar mi propia voz. entiendo que tengo que grabar una cantidad de pocos segundos de cada archivo, aunque más pequeño que si intento entrenar para usar en FakeYou, sí?

Resultado: +0

3550. pianino.64,

como que yo estoy interesado en eso pero antes, probare piper, me interesa

Resultado: +0

3551. Braille_and_Speak2000,

Che Pianino, entrenarías un dataset de tu voz? Porque estoy probando y me encanta! es decir, por ahí la calidad no es la mejor si comparamos con las voces en FakeYou, pero para por fin tenerlas en local, incluso si te ponés a hacerle repetir cadenas de texto, vas a sentir variaciones ligeras, como pasaría en ElevenLabs.
Hice pruebas con signos de exclamación y demás pero no sé si no puedo esperar tanto y justo las exclamaciones no están, o depende de cada voz. Pero por ejemplo ahora estoy con la voz de Oriol, y nada, me encanta. Me recuerda un poco a la vvoz en español España de Google TTS jajajaja

Resultado: +0

3552. pianino.64,

lo pensare, pero por ahoar ayúdenme.
instalé el add on o complemento de NVDA, y no hace nada.
ni siquiera aparece en la lista de sintetizadores, que hacemos?.

Resultado: +0

3553. Braille_and_Speak2000,

La primera vez que abrimos NVDA tras instalar este complemento, nos debería salir un cartel ofreciéndonos entrar al sitio web a descargar los datasets, aunque igual no logré descargar ninguno. Pero con la carpeta de drive que compartieron, yo descomprimí todo en un lugar y solo entré a la web para oír muestras de las voces en español. Nosotros tenemos esa carpeta descomprimida, el addon ya instalado y vamos a las opciones de NVDA, categoría Piper Voice Manager. Tabulamos y como la lista está vacía, nos interesa algo que dice, Install from local file Install a voice from a local archive.
The archive contains the voice model and configuration.
The archive should have a (.tar.gz) file extension.
Damos enter y seleccionamos los archivos con extensión .gz, que los descargamos, aunque tenemos que ir uno por uno. Porque probé seleccionarlos todos de una y solo instaló el último.
eso fue todo, después de instalar todas las voces ya pude usarlo.

Resultado: +0

3554. parangaricutirimicuaro,

yo querí usar las voces que estaban el la página xd

Resultado: +0

3555. gandolfi,

esas voces que comentan cuales son?, y están en español?

Resultado: +0

3556. pianino.64,

negativo, reinicie el complemento y no aparece ningún cartelito.
conste que el complemeto lo baje de git hub, pero si alguien me podría pasar un complemento que sirva?, por que el que tengo no vale para nada

Resultado: +0

3557. Braille_and_Speak2000,

¿Cómo las descargo? O sea, los cuadros combinados ya los descargué y hay un enlace para descargar la voz seleccionada. Hay como 4 o 5 en Español de España pero creo que ya las tenemos también en esta carpeta deDrive, y una voz en español mexicano.
ahora, ¿Qué pasa si se intenta entrenar una voz cantante?
En uanto a la prounciación, toma los diccionarios de ESpeak NG? Porque hay palabras en inglés que las pronuncian muy bien y otras que no.

Resultado: +0

3558. parangaricutirimicuaro,

estuve examinando los archivo y por ejemplo abrimos la voz de mateo, nos abre como si fuese un zip y nos muestra los archivos .jsond. o como sea. ósea que de alguna manera se puede yegar a crear una voz de la huev con esos 2 archivos que se descargan

Resultado: +0

3559. pianino.64,

ayuda, el complemento no sirve!, ni cartelito ni nada, ahí esta como parácito ejecutándose pero no muestra ni un panel ni sintetizaodr ni nada.

Resultado: +0

3560. Delicious_icecream,

me pasa lo mismo que @pianino. Hace cosas bastante extrañas esto.

Resultado: +0

3561. parangaricutirimicuaro,

a que te refieres con cosas extrañas? Symbian_Belle: me pasa lo mismo que @pianino. Hace cosas bastante extrañas esto.: hace 3 minutos

Resultado: +0

3562. pianino.64,

listo asunto arreglado, tuve que actualizar n v d a a la ersion 2023.
la actualice y si funciona piper ahora solo falta bajar las voces.
pero me quede triste por que mis voces retro del otro n v d a ya no funcionan mas

Resultado: +0

3563. El-Megalovano,

Yo quería descargar las voces de portugués de brasil.

Como puedo entrenar una voz? Quiero hacerla con la de Donald Trump o Chriss Christie o Ron desantis...
Hay alguna forma rápida de hacerlo sin tener que pasar por herramientas de desarrollador o un colab de Google o algo ansina?
Endemás cuando uso verbalizar todo en cada línea hace una pausa.
Qué tal si hago un training de las voces de Eloquence, Loquendo u otro sintetizador de voz? Cómo sonarían?

Resultado: +0

3564. pianino.64,

ya probe piper en n v d a.
si , todo muy bonito el problema es que la respuesta de voz es demasiado lenta, o tiene que ver el tipo de voz que uso?

Resultado: +0

3565. Braille_and_Speak2000,

Creo que de todas maneras iba a ser así de lenta al aplicar tecnología neural, pero leí en el readme que tienen planes de cambiar a otro lenguaje de programación para mejorar el rendimiento.

Resultado: +0

3566. gabm,

de donde puedo descargar ese complemento?

Resultado: +0

3567. Braille_and_Speak2000,

Voy a darte la caroeta de drive que pasaron mensajes más arriba, que además de voces en español tiene el addon para NVDA: https://drive.google.com/drive/folders/1zFJRTI6CpVw9NkrTiNYOKGga0yn4JXzv?usp=drive_link

Resultado: +0

3568. amitabh_bachchan ,

justo eso iba a decir. va demasiado lenta y además de eso, me provocó un colapso al sistema, obligando a este a apagarse porque sí :V.

Resultado: +0

3569. Braille_and_Speak2000,

A mí me crasheó NVDA momentáneamente cuando lo puse a leer cadenas y cadenas a esa velocidad que nos movemos nosotros con eloquence. Tal como yo sospechaba, creo que lo de tener síntesis neural a la respuesta de lectura que necesitamos como que estamos medio lejos. Pero ya hay algo, esto nos lo podemos llevar y usar sin Internet al menos.

Resultado: +0

3570. Caracolito,

Hola! Yo acabo de probar este sintetizador, pero me resulta inusable. Creo que vendría muy bien para balabolka o algún programa parecido, pero para NVDA no le veo el sentido, aunque podría probar usarlo para el comando de leer todo, para leer libros por ejemplo...

Resultado: +0

4106 mensajes, 137 páginas:  1; 117 118119 120 121; 137 ↖ Volver a la lista de temas

Responder al tema

Usted debe estar conectado para poder postear.

¿Perdió su contraseña? Crear una cuenta