Clona tu Propia Voz en Minutos con ElevenLabs
ElevenLabs es una empresa dedicada al desarrollo de software especializado en la síntesis de voz y la conversión de texto a voz con un sonido natural, empleando inteligencia artificial y aprendizaje profundo. ¡Hoy te mostraremos cómo clonar tu propia voz en cuestión de minutos!.
¿Qué nos ofrece ElevenLabs?
ElevenLabs ofrece una variedad de productos y herramientas en el campo de la síntesis de voz y la conversión de texto a voz con inteligencia artificial.
Su Generative Voice AI permite convertir texto en discurso en múltiples idiomas, con una amplia gama de voces y estilos. Además, su VoiceLab permite crear y clonar voces de manera personalizada. Otros productos incluyen Dubbing Studio para localizar videos, Speech to Speech para cambiar voces y Projects para generar audio de larga duración. Con un enfoque en la investigación y el desarrollo ético.
En este tutorial nos centraremos en VoiceLab para la clonación de nuestra voz.
1. Regístro a la Plataforma
- Ve a Elevenlabs portal.
- Click sobre Sign up y completa tu registro.
Una vez registrado, esto te llevará directo a su plataforma.
2. Obtén una Suscripción
Nos dirigimos a Menú > Voices > Add Generative or Cloned Voice
Como vemos en la imagen 3, cuando intentamos añadir una nueva voz nos pide una suscripción.
- Hacemos click sobre Instant voice cloning y nos llevará a ver las opciones que nos ofrece.
- En la iamgen 4, podemos todos los paquetes, nosotros en este tutorial elegiremos el paquete Starter, ya que este nos permite clonar nuestra voz e incluso tiene un descuento del 80% el primer mes.
3. Clona tu voz desde la Plataforma
Nos dirigimos a:
Menú > Voices > Instant Voice Cloning >
En esta parte debes :
- grabar o cargar 25 muestras de voz.
- Añadir algunas características tuyas.
- Añadir una breve descripción, esto para que el modelo pueda entrenar con un poco más de contexto.
> Click sobre Add voice.
Y listo, ya tenemos nuestra voz clonada!
Un truco que puedes hacer es subir tus audios de voz de whatsapp.
Usa tu voz clonada
Para esto nos dirigimos a:
Menú > Voices >
- En VoiceLab, identificamos nuestra voz como se ve en la Imagen 6 y le damos click sobre Use.
Una vez dentro, como apreciamos en la imagen 7, podemos ver que estamos usando Text to Speech, lo que quiere decir es que podemos hacer que la herramienta diga con nuestra voz clonada lo que escribamos en este campo.
2. En Settings, es donde podemos modificarla un poco para que se escuche más a nosotros.
3. Escribirmos un texto, en este caso “Saludos desde Datapath!”.
4. Y Con el Boton Generate, hacemos que se genere el audio.
En el lado izquierdo podemos ver y descargar los anteriores audios que hemos generado.
4. Usa la API
También existe la posibilidad de usar esta herramienta desde nuestros entornos locales.
Para esto solo necesitamos seguir estos pasos:
- Obtener tu API Key.
Nos dirigimos a Menú > Click sobre nuestro Usuario > Profile + Api key
Aquí copiamos nuestra key en un lugar seguro.
2. Exporta tu api key con el siguiente comando desde consola:
export ELEVEN_API_KEY = (copy your api key here)
Clona tu voz desde un script
Ahora lo único que debemos hacer es crear un script con esta plantilla para clonar una nueva voz:
from elevenlabs.client import ElevenLabs
from elevenlabs import play
client = ElevenLabs()
voice = client.clone(
name="Sam",
description="An old American male voice with a slight hoarseness in his throat. Perfect for news", # Optional
files=["./sample_0.mp3", "./sample_1.mp3", "./sample_2.mp3"],
)
audio = client.generate(text="Hi! I'm a cloned voice!", voice=voice)
play(audio)
Usa tu voz desde tu entorno local
Si queremos utilizar una voz ya clonada, lo que debemos hacer es:
- Ir nuevamente a la plataforma y obtener el ID de nuestra voz, tal como se muestra en la imagen 9.
En este tutorial, utilizaremos python, pero la API también puede ser utilizada por otros lenguajes, mira la documentacion Text to speech — ElevenLabs .
2. Instalar el módulo elevenlabs con el siguiente comando en consola.
pip install elevenlabs==v1.0.0b1
3. crea un script en python con el siguiente código:
from elevenlabs import Voice, VoiceSettings, play
from elevenlabs.client import ElevenLabs
client = ElevenLabs()
audio = client.generate(
text="Hola mi nombre es Yurika!",
voice=Voice(voice_id='add here your voice id',
settings=VoiceSettings(stability=0.71, similarity_boost=0.5, style=0.0, use_speaker_boost=True)
)
)
play(audio)
#save(audio, "my-file.mp3")
Y listo ya podrás escuchar tu voz clonada desde tu ordenador!.
En la imagen 10 apreciamos que en la plataforma, en la parte de Voices>Use, se puede ver y descargar el audio de tu voz clonada que generamos desde el script.
Conclusiones
ElevenLabs abre un mundo de posibilidades para la creación de contenido a través de la síntesis de voz y la clonación vocal. Con su plataforma fácil de usar y su amplia gama de herramientas, los creadores pueden dar vida a sus ideas de manera más rápida y eficiente que nunca. Desde la narración de historias hasta la producción de videos y podcasts, esta tecnología revolucionaria ofrece un nuevo enfoque para la creación de contenido digital.
Próximos Pasos
Después de haber clonado tu voz con éxito utilizando ElevenLabs, el siguiente paso es explorar aún más las posibilidades que ofrece esta herramienta. Puedes experimentar con diferentes ajustes y estilos de voz, integrar la voz clonada en tus propias aplicaciones a través de la API y unirte a la comunidad de ElevenLabs para compartir experiencias y aprender de otros usuarios.
Gracias por leerme,
¿Quieres seguir aprendiendo y conectarte con nuestra comunidad? Te invitamos a unirte a nuestras redes sociales. ¡Síguenos en Instagram y LinkedIn para estar al tanto de las últimas noticias, tutoriales y recursos sobre tecnología y aprendizaje automático!
Datapath
Acelerando el talento LATAM en data, cloud, analytics e inteligencia artificial
⚪DISCORD: https://go.datapath.ai/Discord_IALatam
🔵Linkedin: https://go.datapath.ai/Linkedin
🟡Instagram: https://go.datapath.ai/Instagram
🔴Facebook: https://go.datapath.ai/Facebook
🟢Tiktok: https://go.datapath.ai/Tiktok