En marzo, vimos el lanzamiento de un “ChatGPT para música” llamado Suno, que utiliza IA generativa para producir canciones realistas a pedido a partir de mensajes de texto breves. Unas semanas más tarde, un competidor similar, Udio, apareció en escena. 

por Oliver Bown
Música generada por IA: ¿y los autores humanos?

He estado trabajando con varias herramientas computacionales creativas durante los últimos 15 años, como investigador y productor, y el ritmo reciente del cambio me ha dejado estupefacto. Como he argumentado en otro lugar , la opinión de que los sistemas de inteligencia artificial nunca producirán música “real” como lo hacen los humanos debe entenderse más como una afirmación sobre el contexto social que sobre la capacidad técnica.

El argumento “claro, puede hacer música original, expresiva, de estructura compleja, de sonido natural, virtuosa, que puede despertar las emociones humanas, pero la IA no puede hacer música adecuada ” puede fácilmente comenzar a sonar como algo sacado de un sketch de Monty Python.

Después de tocar con Suno y Udio, he estado pensando en qué es exactamente lo que cambian y qué podrían significar no sólo para la forma en que los artistas profesionales y aficionados crean música, sino también para la forma en que todos la consumimos.

Expresar emociones sin sentirlas

Generar audio a partir de mensajes de texto en sí no es nada nuevo . Sin embargo, Suno y Udio han hecho un desarrollo obvio: a partir de un simple mensaje de texto, generan letras de canciones (usando un generador de texto similar a ChatGPT), las introducen en un modelo de voz generativo e integran las “voces” con la música generada para producir. un segmento de canción coherente.

Esta integración es una hazaña pequeña pero notable. Los sistemas son muy buenos para componer canciones coherentes que suenen expresivamente “cantadas” (ahí voy antropomorfizando).

El efecto puede ser asombroso. Sé que es IA, pero la voz aún puede generar un impacto emocional. Cuando la música realiza una pirueta de final de compás perfectamente ejecutada en una nueva sección, mi cerebro recibe algunas de esas pequeñas chispas de alegría de procesamiento de patrones que podría tener al escuchar a una gran banda.

Para mí, esto resalta algo que a veces se pasa por alto en la expresión musical: la IA no necesita experimentar emociones y eventos de la vida para expresarlos con éxito en música que resuene en las personas.

La música como lenguaje cotidiano

Al igual que otros productos de IA generativa, Suno y Udio fueron entrenados en grandes cantidades de trabajo existente realizado por humanos reales, y existe mucho debate sobre los derechos de propiedad intelectual de esos humanos .

Sin embargo, estas herramientas pueden marcar el comienzo de la cultura musical dominante de la IA. Ofrecen nuevas formas de participación musical que la gente simplemente querrá usar, explorar, jugar y escuchar para su propio disfrute.

Podría decirse que la IA capaz de crear música “de un extremo a otro” no es una tecnología para los creadores de música, sino para los consumidores de música. Por ahora no está claro si los usuarios de Udio y Suno son creadores o consumidores, o si la distinción es siquiera útil.

Un fenómeno observado desde hace mucho tiempo en las tecnologías creativas es que a medida que algo se vuelve más fácil y barato de producir, se utiliza para una expresión más informal. Como resultado, el medio pasa de ser una forma de arte exclusiva a convertirse en un lenguaje más cotidiano: piense en lo que los teléfonos inteligentes le han hecho a la fotografía.

Así que imagina que puedes enviarle a tu padre una canción producida profesionalmente sobre él para su cumpleaños, con un costo y esfuerzo mínimos, en el estilo de su preferencia: una tarjeta de cumpleaños moderna. Los investigadores han considerado durante mucho tiempo esta eventualidad y ahora podemos hacerlo. ¡Feliz cumpleaños papá!

El blues del señor Bown. Generado por Oliver Bown usando Udio [ 3,75 MB (descargar) ]

¿Puedes crear sin control?

Independientemente de lo que estos sistemas hayan logrado y puedan lograr en el futuro cercano, enfrentan una limitación evidente: la falta de control.

Las indicaciones de texto a menudo no son tan buenas como instrucciones precisas, especialmente en música. Por lo tanto, estas herramientas son aptas para una búsqueda ciega (una especie de deambular por el espacio de posibilidades), pero no para un control preciso. (Eso no es para disminuir su valor. La búsqueda ciega puede ser una poderosa fuerza creativa).

Al considerar estas herramientas como productor musical en ejercicio, las cosas se ven muy diferentes. Aunque la página acerca de Udio dice que “cualquiera con una melodía, alguna letra o una idea divertida ahora puede expresarse en música”, no siento que tenga suficiente control para expresarme con estas herramientas.

Puedo verlos útiles para sembrar materias primas para manipulación, al igual que las muestras y las grabaciones de campo. Pero cuando busco expresarme , necesito control.

Usando Suno, me divertí un poco encontrando los ritmos de techno oscuro más retorcidos que pude sacar. El resultado fue algo que absolutamente usaría en una pista.

Himno de los amantes del queso. Generado por Oliver Bown usando Suno [ 2,75 MB (descargar) ]

Pero descubrí que también podía escuchar con gusto. No sentí ninguna obligación de agregar nada o manipular el resultado para agregar mi marca.

Y muchas jurisdicciones han declarado que no se le otorgarán derechos de autor por algo solo porque usted lo impulsó a existir con IA.

Para empezar, el resultado depende en la misma medida de todo lo que se incorporó a la IA, incluido el trabajo creativo de millones de otros artistas. Podría decirse que no hiciste el trabajo de la creación. Simplemente lo solicitaste.

Nuevas experiencias musicales en la tierra de nadie entre la producción y el consumo

Así que la declaración de Udio de que cualquiera puede expresarse en la música es una provocación interesante. Las personas que usan herramientas como Suno y Udio pueden ser consideradas más consumidores de experiencias musicales de IA que creadores de obras musicales de IA , o como ocurre con muchos impactos tecnológicos, es posible que necesitemos idear nuevos conceptos para lo que están haciendo.

Un cambio hacia la música generativa puede desviar la atención de las formas actuales de cultura musical, así como la era de la música grabada vio la disminución (pero no la muerte) de la música orquestal, que alguna vez fue la única forma de escuchar música compleja, rica en timbres y alta. . Si se dispara la participación en estos nuevos tipos de cultura e intercambio musical, es posible que veamos una reducción de la participación en el consumo de música tradicional de artistas, bandas, radio y listas de reproducción.

Si bien es demasiado pronto para saber cuál será el impacto, debemos estar atentos. El esfuerzo por defender la protección de la propiedad intelectual de los creadores existentes, una importante cuestión de derechos morales, es parte de esta ecuación.

Pero incluso si tiene éxito, creo que no abordará fundamentalmente este cambio cultural potencialmente explosivo, y las afirmaciones de que esa música podría ser inferior tampoco han tenido mucho efecto a la hora de detener el cambio cultural históricamente, como ocurrió con el techno o incluso con el jazz hace mucho tiempo. Es posible que las políticas gubernamentales de IA deban mirar más allá de estas cuestiones para comprender cómo funciona la música socialmente y garantizar que nuestras culturas musicales sean vibrantes, sostenibles, enriquecedoras y significativas tanto para los individuos como para las comunidades.

Fuente: https://singularityhub.com/2024/05/07/ai-can-now-generate-entire-songs-on-demand-what-does-this-mean-for-music-as-we-know-it/

Deja una respuesta