Clona tu Propia Voz en Minutos con ElevenLabs

Macusaya Yurika
Datapath
Published in
5 min readMar 25, 2024

ElevenLabs es una empresa dedicada al desarrollo de software especializado en la síntesis de voz y la conversión de texto a voz con un sonido natural, empleando inteligencia artificial y aprendizaje profundo. ¡Hoy te mostraremos cómo clonar tu propia voz en cuestión de minutos!.

Imagen 1: Elevenlabs cover. Fuente: Elaboración propia.

¿Qué nos ofrece ElevenLabs?

ElevenLabs ofrece una variedad de productos y herramientas en el campo de la síntesis de voz y la conversión de texto a voz con inteligencia artificial.

Su Generative Voice AI permite convertir texto en discurso en múltiples idiomas, con una amplia gama de voces y estilos. Además, su VoiceLab permite crear y clonar voces de manera personalizada. Otros productos incluyen Dubbing Studio para localizar videos, Speech to Speech para cambiar voces y Projects para generar audio de larga duración. Con un enfoque en la investigación y el desarrollo ético.

En este tutorial nos centraremos en VoiceLab para la clonación de nuestra voz.

1. Regístro a la Plataforma

Imagen 2: Sign up ElevenLabs. Fuente: Elaboración propia.

Una vez registrado, esto te llevará directo a su plataforma.

2. Obtén una Suscripción

Nos dirigimos a Menú > Voices > Add Generative or Cloned Voice

Como vemos en la imagen 3, cuando intentamos añadir una nueva voz nos pide una suscripción.

Imagen 3: Elevenlabs platform. Fuente: Elaboración propia.
  • Hacemos click sobre Instant voice cloning y nos llevará a ver las opciones que nos ofrece.
  • En la iamgen 4, podemos todos los paquetes, nosotros en este tutorial elegiremos el paquete Starter, ya que este nos permite clonar nuestra voz e incluso tiene un descuento del 80% el primer mes.
Imagen 4: Elevenlabs prices. Fuente: Adaptado de Eleven labs.

3. Clona tu voz desde la Plataforma

Nos dirigimos a:

Menú > Voices > Instant Voice Cloning >

En esta parte debes :

  1. grabar o cargar 25 muestras de voz.
  2. Añadir algunas características tuyas.
  3. Añadir una breve descripción, esto para que el modelo pueda entrenar con un poco más de contexto.

> Click sobre Add voice.

Y listo, ya tenemos nuestra voz clonada!

Un truco que puedes hacer es subir tus audios de voz de whatsapp.

Imagen 5: Instant cloning Voice. Fuente: Elaboración propia.

Usa tu voz clonada

Para esto nos dirigimos a:

Menú > Voices >

  1. En VoiceLab, identificamos nuestra voz como se ve en la Imagen 6 y le damos click sobre Use.
Imagen 6: VoiceLab Elevenlabs. Fuente: Elaboración propia.

Una vez dentro, como apreciamos en la imagen 7, podemos ver que estamos usando Text to Speech, lo que quiere decir es que podemos hacer que la herramienta diga con nuestra voz clonada lo que escribamos en este campo.

2. En Settings, es donde podemos modificarla un poco para que se escuche más a nosotros.

3. Escribirmos un texto, en este caso “Saludos desde Datapath!”.

4. Y Con el Boton Generate, hacemos que se genere el audio.

Imagen 7: Speech synthesis. Fuente: Elaboración propia.

En el lado izquierdo podemos ver y descargar los anteriores audios que hemos generado.

4. Usa la API

También existe la posibilidad de usar esta herramienta desde nuestros entornos locales.

Para esto solo necesitamos seguir estos pasos:

  1. Obtener tu API Key.

Nos dirigimos a Menú > Click sobre nuestro Usuario > Profile + Api key

Aquí copiamos nuestra key en un lugar seguro.

Imagen 8: Get api key- Elevenlabs. Fuente: Elaboración propia.

2. Exporta tu api key con el siguiente comando desde consola:

export ELEVEN_API_KEY = (copy your api key here)

Clona tu voz desde un script

Ahora lo único que debemos hacer es crear un script con esta plantilla para clonar una nueva voz:

from elevenlabs.client import ElevenLabs
from elevenlabs import play
client = ElevenLabs()
voice = client.clone(
name="Sam",
description="An old American male voice with a slight hoarseness in his throat. Perfect for news", # Optional
files=["./sample_0.mp3", "./sample_1.mp3", "./sample_2.mp3"],
)
audio = client.generate(text="Hi! I'm a cloned voice!", voice=voice)
play(audio)

Usa tu voz desde tu entorno local

Si queremos utilizar una voz ya clonada, lo que debemos hacer es:

  1. Ir nuevamente a la plataforma y obtener el ID de nuestra voz, tal como se muestra en la imagen 9.
Imagen 9: Elevenlab Voicelab- Get voice id. Fuente: Elaboración propia.

En este tutorial, utilizaremos python, pero la API también puede ser utilizada por otros lenguajes, mira la documentacion Text to speech — ElevenLabs .

2. Instalar el módulo elevenlabs con el siguiente comando en consola.

pip install elevenlabs==v1.0.0b1

3. crea un script en python con el siguiente código:

from elevenlabs import Voice, VoiceSettings, play
from elevenlabs.client import ElevenLabs
client = ElevenLabs()
audio = client.generate(
text="Hola mi nombre es Yurika!",
voice=Voice(voice_id='add here your voice id',
settings=VoiceSettings(stability=0.71, similarity_boost=0.5, style=0.0, use_speaker_boost=True)
)
)
play(audio)
#save(audio, "my-file.mp3")

Y listo ya podrás escuchar tu voz clonada desde tu ordenador!.

En la imagen 10 apreciamos que en la plataforma, en la parte de Voices>Use, se puede ver y descargar el audio de tu voz clonada que generamos desde el script.

Imagen 10: Speech synthesis-history. Fuente: Elaboración propia.

Conclusiones

ElevenLabs abre un mundo de posibilidades para la creación de contenido a través de la síntesis de voz y la clonación vocal. Con su plataforma fácil de usar y su amplia gama de herramientas, los creadores pueden dar vida a sus ideas de manera más rápida y eficiente que nunca. Desde la narración de historias hasta la producción de videos y podcasts, esta tecnología revolucionaria ofrece un nuevo enfoque para la creación de contenido digital.

Próximos Pasos

Después de haber clonado tu voz con éxito utilizando ElevenLabs, el siguiente paso es explorar aún más las posibilidades que ofrece esta herramienta. Puedes experimentar con diferentes ajustes y estilos de voz, integrar la voz clonada en tus propias aplicaciones a través de la API y unirte a la comunidad de ElevenLabs para compartir experiencias y aprender de otros usuarios.

Gracias por leerme,

¿Quieres seguir aprendiendo y conectarte con nuestra comunidad? Te invitamos a unirte a nuestras redes sociales. ¡Síguenos en Instagram y LinkedIn para estar al tanto de las últimas noticias, tutoriales y recursos sobre tecnología y aprendizaje automático!

Datapath

Acelerando el talento LATAM en data, cloud, analytics e inteligencia artificial

⚪DISCORD: https://go.datapath.ai/Discord_IALatam

🔵Linkedin: https://go.datapath.ai/Linkedin

🟡Instagram: https://go.datapath.ai/Instagram

🔴Facebook: https://go.datapath.ai/Facebook

🟢Tiktok: https://go.datapath.ai/Tiktok

--

--