Hilo oficial sobre los sintetizadores de voz

4106 mensajes, 137 páginas:  1; 114 115116 117 118; 137 ↖ Volver a la lista de temas

Resultado: +40

3451. ivanack13,

yo tambien me esperro , quiero aprender a crearlos , será como incubar a tu artista faborito jajajaja

Resultado: +0

3452. rmcpantoja,

Buenas, el cuaderno ya está disponible en nuestro repositorio de GitHub. Haremos un vídeo tutorial pronto, una parte para los demás como otra para accesibilidad: https://colab.research.google.com/github/rmcpantoja/My-Colab-Notebooks/blob/main/notebooks/Cuaderno_completo_de_So_Vits_SVC_en_espa%C3%B1ol.ipynb

Resultado: +0

3453. James_Potter,

No se ha encontrado el cuaderno
No se ha podido cargar este cuaderno. Comprueba que se puede acceder al archivo y vuelve a intentarlo.

Resultado: +0

3454. gabm,

am[i me aparece algo similar, no copi[e el msj completo> No se encontró el bloc de notas
Se produjo un error al cargar este bloc de notas. Asegúrate de que se pueda acceder al archivo y vuelve a intentarlo.
Asegúrate de tener permiso para ver este bloc de notas en GitHub y autoriza a Colaboratory para usar la API de GitHub.
https://github.com/rmcpantoja/My-Colab-Notebooks/blob/main/notebooks/Cuaderno_completo_de_So_Vits_SVC_en_espa%C3%B1ol.ipynb
Could not find Cuaderno_completo_de_So_Vits_SVC_en_español.ipynb in

Resultado: +0

3455. James_Potter,

logueate con GitHub y te v a a s alir la lista de cuadernos, ahí sale lo clickeás y anda.

Resultado: +0

3456. rmcpantoja,

Hola. Disculpas por las molestias, el cuaderno ya está arreglado,por lo que el enlace de mi post anterior debería abrirlo.

Resultado: +0

3457. James_Potter,

Yo con mi pregunta tonta: no entiendo si quiere que ponga el id en el que está el zip o el archivo de pytorch.
ID de Drive del archivo del modelo a descargar:

Resultado: +0

3458. Braille_and_Speak2000,

ahí estoy yo con mis tonteras Random. ahora si me mandan un WP le puse al celu como tono de notificación a Jorge diciendo: No seas imbécil. xd

Resultado: +0

3459. Mr.Ipertarboo,

pregunta desde mi ignorancia, pero, para que sirve eso de los cuadernos?

Resultado: +0

3460. pianino.64,

no se abre ese cuaderno, n ni siquiera en git hub, traten de arreglar la dirección o que el cuaderno este funcionando correctamente.
o sino pongan un enlace que sea correcto por que no se puede acceder

Resultado: +0

3461. eduardo-petrini,

pianino, ten paciencia. al publicarse las cosas puede que surjan contratiempos como a todos! lo digo por experiencia propia...

Resultado: +0

3462. pianino.64,

he descubierto que cuando haces un dataset para dif o sovits es mas fácil hacerlos por que solo le das al sistema audios
em recuerda los tiempos en que hacia datasets para texto a voz.
si, era tedioso escribir el texto a cada archivo de audio, pero sinceramente me gusta

Resultado: +0

3463. gabm,

amí ya me lo abrió

Resultado: +0

3464. pianino.64,

no abre, me pide autorizar con git hub.
luego le doy al otro enlace alternativo que aparece en git hub y dice, page not found, pagina no encontrada

Resultado: +0

3465. gabm,

amí me e estado fijando, y abecés me abre y abecés no, detodos modos, no se si funcione pero puse para que hiciera copia en google drive

Resultado: +0

3466. pianino.64,

lo intentare otra vez, vamos a veri si vale

Resultado: +0

3467. James_Potter,

Che revivo esto que es interesante y a ver si sale el tutorial.

Resultado: +0

3468. gabm,

esperemos que sí, xd

Resultado: +0

3469. el-javi,

hola chicos: paso para preguntar, si tienen el bocalóy. ese sintitisadór que canta: porqué el dedtál no canta onosé como asérlo cantár.

Resultado: +0

3470. pianino.64,

he querido contarles que acabo de comprar una voz de cepstral.
bueno la compre el viernes.
y de paso voy a contarles como me fue.
casi nadie conoce esas voces de cepstral, que desde el 2004 se sabe que existe.
para ese entonces era el motor de síntesis mas avanzado que había, con voces en varios caracteres y algunos idiomas.
ha mejorado un poco las voces en español, pero no compre una de esas voces.
compré una de las voces que ellos llaman carácter voices, cepstral shouty.
quizá esta voz sea anticuada, pero en inglés te grita el texto que va leyendo.
aparentemente hay dos precios de sintetizadores de voz.
los que cuestan 45 dólares que son de alta calidad, o los que cuestan 10 dólares, la que compre que es la voz del gritón cuesta 10 dólares.
ahora no se fien que a parte de la voz compras la licencia de uso.
las voces de 10 dólares podrían subir el precio dependiendo la licencia, y las de 45 dólares también.
las voces de 10 dólares podrían costar 40 dólares comprando la licencia completa, y las de 45 dólares podrían llegar a costar 120 dólares comprando la licencia completa.
ceptral se maneja por 4 licencias.
básica, accesible, estándar, y pro.
en todas ellas se instala la voz que compraste, mas el programa que lo acompaña Swift talker, que es un eiditor de texto y convierte archivos en wav con las voces de cepstral.
si te bajas cualquiera de las voces sin comprar, puede que se instalen.
pero te dan solo 10 segundos de texto, luego de lo cual te va diciendo, por favor registrame, luego vuelve a leer y otra vez dice por favor registrame.
como demo esta terrible, toca comprar la voz!.
licencia básica.
dependiendo del estilo de voz que compres puede costar o 10 dólares o 45 dólares.
te da derecho a usar las voces de cepstral con el Swift talker solamentey aunque se instala también como sapi 5, si se opera en ese modo va a salir el cartel que lo registren y que la voz te lo recuerde acada rato, la versión bbásica te deja usar las voces de cepstral solo dentro de su aplicación nativa.
cuando conviertes el texto en audio, te salta una advertencia que es solo de uso personal la conversión y no puedes compartirlo con nadie mas.
versión accesible.
puede costar o 20 o 55 dólares.

esta versión es pensada para trabajar con lectores de pantalla como jaws, y window eyes.
esta también funciona con el Swift talker y también si isntalas el driver de jaws y el de window eyes, y seleccionando su sintetizador desde las configuraciones.
en sapi 5 igual te pide que lo registre, y la advertencia de no compartir estos archivos cuando conviertes el texto en audio.
standard.
puede costar o bien 30 dólares o bien 80 dólares.
aquí las voces de cepstral que compraste trabajan en sapi 5 por fin, y con el Swift talker, si tienes lectores de pantalla trabaja igual.
sin embargo sigue saltando la advertencia de siempre al convertir texto en audio.
pro o licencia comercial.
o 40, o 120 dólares.
aquí ya tienes las voces cepstral completitas, swif talker, lector sapi 4, sapi 5, y licencia de uso comercial.
ahora ya no te salta la advertencia de siempre al convertir texto en audio, por que ahora si te deja que publiques esos audios libremente donde quieras.
con la licencia comercial dicho cartel desaparece.
para ver los precios de las voces mas sus licencias, obligado tienes que crearte una cuenta en cepstral.
con ttodo y su confirmación una vez que entraste con tu cuenta registrada, ahí recién ves los precios y todo.
puedes pagar con tarjeta de crédito y pay pal.
yo vi que no hubo mucha actualisacoin con las voces de cepstral, siguen están do las mismas viejas voces, pero ya un poquito mas estables y mejoradas.

Resultado: +0

3471. ivanack13,

para los que están armando los datacets de las voces del cuaderno , solo se le puede poner la voz cantando? o también cuando habla en siertos fragmentos de la canción , como algunos lo hacen , o los jestos con la voz que propiamente no son canto

Resultado: +0

3472. pianino.64,

lista de voces de cepstral hasta ahora 2023.
estas son las voces que cuestan 45 dólares.
inglés estados unidos.
David.
quizá la mejor lograda de ceptral y su voz de bandera, algunas veces suena robótico pero puede salir lo natural también, un tono grave y tranquilo.
alison.
esta es la voz premium femenina que acompaña a david, su calidad esta muy bien, y suena muy realista, con un toque de alegría.
cally
esta voz ha ido mejorando con el tiempo, y ahoar suena muy bien, es la única voz de cepstral a 22 kHz, el resto es a 16 kHz.
Wiliam.
esta es una de mis favoritas de cepstral por tener un tono grave de locutor.
las voces cepstral en otros idiomas también cuestan 45 dólares.
inglés reino unido.
Laurence.
una voz sofisticada, algo ceremoniosa, como que fuera demasiado solebne.
audrie.
la voz femenina en ingles británico, no está bien lograda.
Francés Canadá.
gean Pierre, no está mal, y tiene un buen tono y dicción.
isabele, no sabemos por que ciertas voces femeninas de cepstral fallan en su entonación, ecepto alison, esta tampoco se salva del problema.
vitoria, italiano.
la voz esta muy bien.
Español.
miguel.
bazada en un famoso locutor chileno, esta voz tal vez no suene realista, pero es algo desente para audiolibros.
Alejandra.
esa esta voz es muy convincente, natural y muy buena.
Alejandra remplaza a la antigua voz de marta, que tenía demasiados problemas en la entonación.
10 dólares.
las siguientes voces tiene un coste de 10 dólares, todas en inglés estados unidos.
Amy.
esta voces es de una jovencita universitaria, pensada para la gente joven, tiene ciertos problemas de entonación típico de las voces de cepstral pero se puede usar para muchas cosas.
dunkan.
con un fuerte acento escocés puedes hacer que lea tus libros.
linda.
no esta tan mal pero su voz es algo triste.
Emily. también tiene fuertes problemas de entonación, pero es soportable.
robin.
supuestamente es la voz infantil de cepstral, pero no es mas que la voz de linda con pitch arriba.
Walter.
me gusta esta voz!, una voz de abuelito, u hombre mayor, si quieres sentir que tu abuelito te cuente cuenttos, usa la voz de Walter.
carácter voices.
estas también cuestan 10 dólares pero son algo extrañas pero muy buenas a la vez.
damian.
pensada para historias de terror, es la voz de wiliam pero con pitch abajo y efecto de chorus.
duchece,
se supone que es voz de la realeza pero a mi me suena como voz de idiota.
es la voz de Emily con pitch abajo.
dog.
sí, es un perrito!, escribe cualquier texto, y ladra el perro!.
shouty.
te lee el texto que quieras, una voz masculina, pero te lee a gritos todo.
wisper.
una voz masculina también pero te susurra, perfecto para audios ASMR.
para probar estas voces visita www.cepstral.com
puedes escuchar los demos pregrabados, o escribir tu propio texto, solo 100 caracteres permite.

Resultado: +0

3473. rmcpantoja,

Hola.

@James_Potter, referente a lo de la id del modelo. Sí, efectivamente, es el ID De Drive del modelo en torch (precisamente el generator, g_xxxx.pth), al igual que el config.json que se guarda en el mismo directorio que en el del modelo.

@ivanack13, funciona tanto con canto como con habla, aunque lo último también es bastante decente. Es más, la siguiente demo la entrené con un dataset que contiene 25 minutos de habla (omitiendo las transcripciones del dataset original): https://www.youtube.com/watch?v=OLSMRoYhwTY

Referente al tutorial, es un guion de 8 secciones el cual estamos concluyendo y es posible que lo tengamos todo entre estas semanas.

Resultado: +0

3474. alaska ,

uuufff. Estoy probando las voces de cepstral. No pago ni 1 $ por esto. En fin... sobre gustos, colores.

Resultado: +0

3475. pianino.64,

realmente yo no se que hice mal aquí!.
mi primer modelo de voz no me lo acepta en ningún lado, ni en ningún cuaderno.
yo no se que hice mal para que no agarrara, aquí les dejo si le hacen funcionar, en hora buena.
https://drive.google.com/file/d/1cqYS4N2SiWnSsdmTAaI0p2Kr7K7uybTj/view?usp=sharing

Resultado: +0

3476. James_Potter,

Che igual el último commit borraron el cuaderno.

Resultado: +0

3477. vrivri,

nadie: tengo el vocaloid, es una verción gratis, así que no creo ser problema compartirlo por acá. pero aún así, te mando en pribado.

Resultado: +0

3478. Braille_and_Speak2000,

che Pianino, quiénes estarán detrás de las voces de Miguel y Marta? De dónde será ella también, chilena?
Yo al que sería Miguel no le sentía el acento chileno, más bien un mexicano medio desentonado pero claro, estoy con una versión más antigua. ¿Y supiste dónde estaban exactamente los problemas con la entonación de Marta? Porque de hecho en las versiones 5 suena como si fuese a llorar.

Resultado: +0

3479. gabm,

a yo tb quisiera probar el vocaloid

Resultado: +0

3480. Mi-precioso ,

Pianino, no funciona porque el enlace está mal. Tienes que borrar el "file" y ponerlo como enlace de descarga directa.

Resultado: +0

4106 mensajes, 137 páginas:  1; 114 115116 117 118; 137 ↖ Volver a la lista de temas

Responder al tema

Usted debe estar conectado para poder postear.

¿Perdió su contraseña? Crear una cuenta