Hilo oficial sobre los sintetizadores de voz

4106 poruka, 137 stranica:  1; 117 118119 120 121; 137 ↖ Vrati se nazad na listu tema

Skor: +40

3541. camello-con-cuello ,

hola. ¿alguien sabe por qué en el motor de texto a voz en los teléfonos sangsung la voz de España masculina se ultra traba? pregunto porque antes no hacía eso

Skor: +0

3542. pianino.64,

hagan lo que yo.
en internet archive busquen el window eyes demo 4.0 o 4.1 creo que era.
ahí trae eloquence con todo cargado

Skor: +0

3543. gandolfi,

hola alguien tiene la canción te necesito de amaral cantada por jaws?

Skor: +0

3544. El-Megalovano,

Compañers, sabían que ahora en ElevenLabs puedes compartir voces? Solamente las generativas y no clonadas, los advierto.
Y para los que quieren voces neuronales sin conexión pues los que tengo es esto: gaita.
https://github.com/mush42/piper-nvda

Skor: +0

3545. amitabh_bachchan ,

cómo es que se hace para usar las voces de este sinte? me lleva a la web y luego me aparece para descargar, pero no sé qué descargar exactamente. alguien que explique mejor el procedimiendo?

Skor: +0

3546. Delicious_icecream,

yo solo encuentro archivos con extensión .onnx

Skor: +0

3547. rmcpantoja,

Buenas, El proceso de instalación de las voces en piper es simple:
Una vez instalado, habrá una nueva categoría piper voice manager la cual nos permite administrar estas voces. Se debe seleccionar la opción install voice from local file... y, dentro del explorador, seleccionar el archivo con extensión .tar.gz del paquete. De paso, aprovecho el post para compartir una carpeta con voces en español que he estado haciendo, y si alguien tiene datasets estaré gustoso de entrenarlos: https://drive.google.com/drive/folders/1zFJRTI6CpVw9NkrTiNYOKGga0yn4JXzv?usp=drive_link

Skor: +0

3548. Delicious_icecream,

lo que decía es que en el repo de github solo aparecen unos archivos con extensión .onnx, no encuentro ningún .tar.gz. Por otro lado, estoy descargando la carpeta que dijiste @rmcpantoja, a ver si funca.

Skor: +0

3549. Braille_and_Speak2000,

Che rmcpantoja, te pregunto. Son compatibles los datasets utilizados para las voces que entrenan por ahí para los covers, usar con FkeYou y demás o al ser otro sintetizador usa otra IA aparte nada que ver? O habría una forma de imporatr para este sinte los datasets que ya hay por ahí, por ejemplo así leemos con voces de cantantes determinados? Porque supongo que todo el proceso de entrenamiento será similar.
Este sí que fue un gran aportazo, yo ya estaba esperando personalmente voces impulsadas por IA para usar con NVDA. Según como fuere el proceso, quiero entrenar mi propia voz. entiendo que tengo que grabar una cantidad de pocos segundos de cada archivo, aunque más pequeño que si intento entrenar para usar en FakeYou, sí?

Skor: +0

3550. pianino.64,

como que yo estoy interesado en eso pero antes, probare piper, me interesa

Skor: +0

3551. Braille_and_Speak2000,

Che Pianino, entrenarías un dataset de tu voz? Porque estoy probando y me encanta! es decir, por ahí la calidad no es la mejor si comparamos con las voces en FakeYou, pero para por fin tenerlas en local, incluso si te ponés a hacerle repetir cadenas de texto, vas a sentir variaciones ligeras, como pasaría en ElevenLabs.
Hice pruebas con signos de exclamación y demás pero no sé si no puedo esperar tanto y justo las exclamaciones no están, o depende de cada voz. Pero por ejemplo ahora estoy con la voz de Oriol, y nada, me encanta. Me recuerda un poco a la vvoz en español España de Google TTS jajajaja

Skor: +0

3552. pianino.64,

lo pensare, pero por ahoar ayúdenme.
instalé el add on o complemento de NVDA, y no hace nada.
ni siquiera aparece en la lista de sintetizadores, que hacemos?.

Skor: +0

3553. Braille_and_Speak2000,

La primera vez que abrimos NVDA tras instalar este complemento, nos debería salir un cartel ofreciéndonos entrar al sitio web a descargar los datasets, aunque igual no logré descargar ninguno. Pero con la carpeta de drive que compartieron, yo descomprimí todo en un lugar y solo entré a la web para oír muestras de las voces en español. Nosotros tenemos esa carpeta descomprimida, el addon ya instalado y vamos a las opciones de NVDA, categoría Piper Voice Manager. Tabulamos y como la lista está vacía, nos interesa algo que dice, Install from local file Install a voice from a local archive.
The archive contains the voice model and configuration.
The archive should have a (.tar.gz) file extension.
Damos enter y seleccionamos los archivos con extensión .gz, que los descargamos, aunque tenemos que ir uno por uno. Porque probé seleccionarlos todos de una y solo instaló el último.
eso fue todo, después de instalar todas las voces ya pude usarlo.

Skor: +0

3554. parangaricutirimicuaro,

yo querí usar las voces que estaban el la página xd

Skor: +0

3555. gandolfi,

esas voces que comentan cuales son?, y están en español?

Skor: +0

3556. pianino.64,

negativo, reinicie el complemento y no aparece ningún cartelito.
conste que el complemeto lo baje de git hub, pero si alguien me podría pasar un complemento que sirva?, por que el que tengo no vale para nada

Skor: +0

3557. Braille_and_Speak2000,

¿Cómo las descargo? O sea, los cuadros combinados ya los descargué y hay un enlace para descargar la voz seleccionada. Hay como 4 o 5 en Español de España pero creo que ya las tenemos también en esta carpeta deDrive, y una voz en español mexicano.
ahora, ¿Qué pasa si se intenta entrenar una voz cantante?
En uanto a la prounciación, toma los diccionarios de ESpeak NG? Porque hay palabras en inglés que las pronuncian muy bien y otras que no.

Skor: +0

3558. parangaricutirimicuaro,

estuve examinando los archivo y por ejemplo abrimos la voz de mateo, nos abre como si fuese un zip y nos muestra los archivos .jsond. o como sea. ósea que de alguna manera se puede yegar a crear una voz de la huev con esos 2 archivos que se descargan

Skor: +0

3559. pianino.64,

ayuda, el complemento no sirve!, ni cartelito ni nada, ahí esta como parácito ejecutándose pero no muestra ni un panel ni sintetizaodr ni nada.

Skor: +0

3560. Delicious_icecream,

me pasa lo mismo que @pianino. Hace cosas bastante extrañas esto.

Skor: +0

3561. parangaricutirimicuaro,

a que te refieres con cosas extrañas? Symbian_Belle: me pasa lo mismo que @pianino. Hace cosas bastante extrañas esto.: hace 3 minutos

Skor: +0

3562. pianino.64,

listo asunto arreglado, tuve que actualizar n v d a a la ersion 2023.
la actualice y si funciona piper ahora solo falta bajar las voces.
pero me quede triste por que mis voces retro del otro n v d a ya no funcionan mas

Skor: +0

3563. El-Megalovano,

Yo quería descargar las voces de portugués de brasil.

Como puedo entrenar una voz? Quiero hacerla con la de Donald Trump o Chriss Christie o Ron desantis...
Hay alguna forma rápida de hacerlo sin tener que pasar por herramientas de desarrollador o un colab de Google o algo ansina?
Endemás cuando uso verbalizar todo en cada línea hace una pausa.
Qué tal si hago un training de las voces de Eloquence, Loquendo u otro sintetizador de voz? Cómo sonarían?

Skor: +0

3564. pianino.64,

ya probe piper en n v d a.
si , todo muy bonito el problema es que la respuesta de voz es demasiado lenta, o tiene que ver el tipo de voz que uso?

Skor: +0

3565. Braille_and_Speak2000,

Creo que de todas maneras iba a ser así de lenta al aplicar tecnología neural, pero leí en el readme que tienen planes de cambiar a otro lenguaje de programación para mejorar el rendimiento.

Skor: +0

3566. gabm,

de donde puedo descargar ese complemento?

Skor: +0

3567. Braille_and_Speak2000,

Voy a darte la caroeta de drive que pasaron mensajes más arriba, que además de voces en español tiene el addon para NVDA: https://drive.google.com/drive/folders/1zFJRTI6CpVw9NkrTiNYOKGga0yn4JXzv?usp=drive_link

Skor: +0

3568. amitabh_bachchan ,

justo eso iba a decir. va demasiado lenta y además de eso, me provocó un colapso al sistema, obligando a este a apagarse porque sí :V.

Skor: +0

3569. Braille_and_Speak2000,

A mí me crasheó NVDA momentáneamente cuando lo puse a leer cadenas y cadenas a esa velocidad que nos movemos nosotros con eloquence. Tal como yo sospechaba, creo que lo de tener síntesis neural a la respuesta de lectura que necesitamos como que estamos medio lejos. Pero ya hay algo, esto nos lo podemos llevar y usar sin Internet al menos.

Skor: +0

3570. Caracolito,

Hola! Yo acabo de probar este sintetizador, pero me resulta inusable. Creo que vendría muy bien para balabolka o algún programa parecido, pero para NVDA no le veo el sentido, aunque podría probar usarlo para el comando de leer todo, para leer libros por ejemplo...

Skor: +0

4106 poruka, 137 stranica:  1; 117 118119 120 121; 137 ↖ Vrati se nazad na listu tema

Odgovori na temu

Morate da se prijavite kako biste mogli da pišete

Zaboravljena lozinka? Napravi nalog