Diaz Gustavo
June 14, 2023
¿Qué es MusicGen de Meta y cómo usarlo?

Prepárese para ingresar a una nueva era en la industria de la música, ya que Meta anunció recientemente el lanzamiento de MusicGen, un generador de música impulsado por inteligencia artificial que promete revolucionar la forma en que creamos y consumimos música.

Este anuncio se produce inmediatamente después de una intensa competencia en el espacio de generación de música de IA, y la oferta de Meta se destaca como un competidor impresionante.

Así es como Felix Kreuk explica Meta MusicGen en Twitter:

¿Qué es Meta Music Gen?

Meta MusicGen, construido sobre la base de un poderoso modelo de Transformer, sigue los pasos de modelos de lenguaje como ChatGPT, empleando tecnología de inteligencia artificial de vanguardia para predecir y generar segmentos de música. Así como un modelo de lenguaje anticipa las siguientes letras en una oración, MusicGen predice el siguiente segmento musical basado en una pieza musical determinada.

Para lograr esta hazaña, los investigadores de Meta utilizan el tokenizador de audio EnCodec, que disecciona los datos de audio en unidades más pequeñas para un procesamiento eficiente. La brillantez de MusicGen radica en su capacidad para manejar simultáneamente descripciones textuales y señales musicales, lo que da como resultado una fusión perfecta de expresión artística.

La capacitación de MusicGen implicó el uso de un vasto conjunto de datos que consta de 20,000 horas de música autorizada. El equipo aprovechó una colección interna de 10 000 grabaciones de audio de alta calidad, complementada con datos musicales de fuentes acreditadas como Shutterstock y Pond5. Este meticuloso proceso de capacitación garantiza que MusicGen posea la destreza para crear música que resuene en los oyentes.

Generación musical en su máxima expresión.

Si bien varios modelos de IA se han destacado en la generación de texto, la síntesis de voz y la creación visual, la generación de música de alta calidad sigue siendo relativamente escasa. Las composiciones intrincadas de la música, los instrumentos superpuestos y la necesidad de capturar el espectro de frecuencia completo plantean desafíos importantes.

Sin embargo, MusicGen aborda estos obstáculos de frente, allanando el camino para una experiencia musical sin precedentes.

¿Cómo usar Meta MusicGen?

Los usuarios ansiosos por explorar las capacidades de MusicGen pueden acceder a él a través de la API Hugging Face. Sin embargo, dependiendo de la carga de usuarios simultáneos, el proceso de generación de música puede llevar algún tiempo. Alternativamente, para obtener resultados más rápidos, los usuarios tienen la opción de configurar su propia instancia del modelo a través del sitio web Hugging Face usando este enlace .

Los expertos en codificación pueden incluso descargar el código y ejecutarlo manualmente para un enfoque más práctico.

Usar MusicGen es un proceso sencillo. Aquí está cómo hacerlo:

  1. Visite el sitio web de Hugging Face
  2. Haga clic en "Espacios" ubicado en la esquina superior derecha
  3. Busque "MusicGen" en el cuadro de búsqueda proporcionado
  4. Busca la versión publicada por Facebook
  5. Ingrese el mensaje deseado en el cuadro de la izquierda
  6. Haga clic en "Generar"

¿Cómo funciona Meta MusicGen?

Con MusicGen, su descripción se convierte en el catalizador para la creación de un segmento de audio de 12 segundos. Para aquellos que buscan un toque más personalizado, el modelo también da cabida a la inclusión de un archivo de audio de referencia, que sirve como base para una melodía compleja. Al combinar la descripción y la melodía provista, MusicGen se esfuerza por producir música que realmente resuene con las preferencias del usuario.

En una comparación cara a cara, MusicGen eclipsa a sus competidores, incluidos Google MusicLM, Riffusion y Musai. Los investigadores demuestran el rendimiento superior de MusicGen presentando un sitio web de muestra con estos modelos.

MusicGen ofrece cuatro tamaños de modelo diferentes, que van desde los compactos 300 millones de parámetros hasta los robustos 3,300 millones de parámetros, desbloqueando el potencial para composiciones intrincadas y fascinantes. Para operar los modelos localmente, se recomienda utilizar una GPU con un mínimo de 16 GB de RAM.

La visión de Meta para el Metaverso

MusicGen representa solo una de las muchas formas en que Meta utiliza la IA para crear experiencias inmersivas y cautivadoras para sus usuarios. A medida que Meta continúa avanzando hacia la realización de un mundo virtual compartido llamado metaverso, donde las personas pueden interactuar, colaborar y divertirse a través de múltiples plataformas y dispositivos, MusicGen está configurado para infundir al metaverso una nueva sensación de entretenimiento y encanto musical.

Ir al Inicio