Musique artificielle

Fabien Lenthy
Jalgos — A.I. Builders
6 min readJul 9, 2019

Les musiciens seront-ils remplacés par des intelligences artificielles d’ici 10 ans ?

Illustration de Faustine Clavert

Les capacités des intelligences artificielles ont explosé ces dernières années, notamment avec le développement du deep learning (apprentissage profond). Cette technologie permet déjà un énorme progrès dans le domaine de la reconnaissance d’image. Il y a 10 ans encore elle en était à ses balbutiements. Aujourd’hui nous commençons à avoir suffisamment confiance en elle pour laisser nos voitures se conduire toutes seules. Le deep learning étant encore très récent, certains domaines d’application ont une très grande marge de progression. C’est notamment le cas de la musique : reconnaissance de titre (Shazam), détection de style ou encore composition automatique. Beaucoup de travail est fait sur cette dernière technologie depuis quelques années. Et bien que les résultats ne soient pas des chef d’oeuvres, il faut admettre qu’ils sont impressionnants.

Que peut faire une intelligence artificielle en musique aujourd’hui ?

La génération de musique reste aujourd’hui un domaine dans lequel l’intelligence artificielle est loin du travail des musiciens. Mais il y a quelques exemples bluffants qui montrent que nous avons franchi une étape importante :

  • Génération de musique baroque (résultats à 12:30) : Une base de données de musique baroque est ici transformée en texte (chaque note du piano est associée à un caractère ASCII et chaque unité de temps est séparée par un espace) puis utilisée pour entraîner un réseau de neurone générateur de texte. Cette technologie étant très performante, les résultats sont convaincants. Toute structure musicale est apprise par le réseau de neurone, aucune règle n’est inscrite dans le code. Si le résultat est un peu décousu, il contient toutefois des motifs intéressants. Cette méthode fonctionne pour de la musique baroque, mais ses résultats seraient moins appréciables sur un style de musique plus libre comme le jazz ou pour de la composition avec plusieurs instruments.
  • Composition de Google Magenta : L’une des premières musiques artificielles composées par Google. La musique est structurée (on arrive à reconnaître les temps forts et la tonalité de la mélodie) mais le thème est simpliste.
  • Improvisation, toujours avec Google Magenta : Ce compositeur artificiel peut être influencé par un humain sur plusieurs paramètres : fréquence des notes à utiliser, densité, ou encore inspiration (à partir d’une entrée midi, le format numérique de la musique qui permet notamment à l’ordinateur d’interpréter ce qui est joué sur un piano électrique). Les résultats contiennent des motifs très intéressants qui ont l’air de sortir directement de la base de données d’entraînement mis ensemble aléatoirement. Qu’il y ait surapprentissage ou pas, le résultat reste pertinent.
  • AIVA, assistant à la composition : Permet de générer des musiques complètes avec plusieurs instruments dans un style donné. Les musiques d’AIVA sont impressionnantes. Elles contiennent une mélodie, un accompagnement, une base rythmique et une structure logique. Certains motifs reviennent souvent lors des compositions (par exemple l’alternance entre deux notes sur plusieurs mesures) et certaines suites d’accords sonnent faux. Mais cela reste très bon pour un outil vendu comme un assistant à la composition.

Nous n’avons pas de très bons compositeurs artificiels ici, mais en les prenant comme des assistants, ils sont tout à fait capables de produire des éléments intéressants qui pourront ensuite être utilisés par de vrais musiciens.

Il y a plusieurs types de compositeurs artificiels :

  • Le compositeur influencé par le travail d’un artiste en particulier, permettant de produire des musiques “dans le style” de cet artiste (exemple : Daddy’s car, une chanson composée par une IA dans le style des Beatles)
  • Le compositeur influencé par un style de musique donné (exemple : ce que propose AIVA)
  • Le compositeur “libre” (ayant appris avec des sources diverses)
  • Le compositeur auquel on impose un motif plus ou moins court (on peut en trouver un exemple sur ce site avec une composition démarrant sur la première mesure de la marche Turque de Mozart puis continuant sous l’influence de Chopin)

Tous ces exemples sont entraînés sur des bases de données midi et écrivent la musique aussi au format midi. Apprendre sur des fichiers audios permettrait d’avoir de plus grandes bases de données mais il serait beaucoup plus difficile pour l’IA d’apprendre à créer des sons cohérents. Nous avons vu avec le premier exemple qu’un fichier midi peut être vu comme un fichier texte, mais nous pouvons aussi le changer en image et appliquer des algorithmes de génération d’image. Les LSTM (Long Short-Term Memory) sont souvent utilisés dans la génération de musique, car ils peuvent capturer la logique derrière les suites de notes des données d’entraînement. Le reinforcement learning est nécessaire pour introduire un peu de créativité car les LSTM seuls ont tendances à reproduire en boucle les mêmes schémas.

Certaines de ces IA, en plus d’apprendre à produire des suites de notes cohérentes dans une tonalité donnée, apprennent aussi à structurer la musique en mesures régulières voire en groupes de mesures (AIVA crée des musiques avec une structure couplet / refrain).

Beaucoup de ces exemples sont plus des expériences musicales que de vrais outils destinés à produire de la musique. Nous pouvons trouver beaucoup de sites internets qui proposent de petites expériences sous forme de jeu ou de simple interface musicale, notamment sur le site de Google Magenta dédié aux expériences artistique de Google.

Quelles utilisations pourrait-on voir dans un futur proche ?

Les assistants à la composition pourraient être utilisés par des artistes pour produire plus vite. Nous avons déjà un exemple d’album composé avec l’aide d’une IA créée par Amper et vendue par son fondateur comme un outil permettant de créer plus efficacement et pouvant être utilisé par des non-musiciens. La première chanson de cet album a été vue près de 2 millions de fois sur YouTube et a reçu un accueil globalement positif.

Nous pouvons aussi imaginer des albums entiers composés par des IA, ou des films / séries / jeux vidéo dont les musiques seront toutes générées par des machines avec pour seule intervention humaine le choix de l’ambiance voulue. Par exemple, dans un jeu vidéo, au lieu de composer des musiques pour chaque zone de jeu, nous pourrions avoir une IA qui joue à l’infini avec une indication par zone (une petite musique joyeuse dans la ville du héros, une musique mystérieuse dans une forêt sombre, …)

Mais alors quelles conséquences pour les musiciens ?

Je ne pense pas que l’intelligence artificielle puisse bouleverser le milieu de la musique, puisque nous n’en avons tout simplement pas besoin. Certes il est intéressant de voir jusqu’où nos IA peuvent aller dans la composition musicale, certes on pourrait augmenter la productivité de grands artistes. Mais ça ne suffirait pas à justifier le remplacement des musiciens par des IA, puisqu’il ne s’agit pas d’une industrie qui a besoin d’optimisation. Nous allons peut-être voir de plus en plus d’artistes utiliser les IA afin de les assister dans la composition de leurs musiques, voire pour composer des albums entiers à la chaîne. Mais les artistes “authentiques” ne vont pas disparaître pour autant. L’industrie de la musique ne répond pas juste à un besoin d’écouter de la musique, mais aussi à un besoin d’en jouer. Et tant qu’un artiste joue (bien) de la musique, il trouvera un public pour l’écouter. Ce n’est pas parce qu’une IA peut produire 1000 chansons par jour qu’elle volera le public des autres artistes.

Conclusion

Voila mon avis : l’application de l’IA du côté de la musique ne devrait se voir que comme une expérimentation, une exploration de ce que l’IA peut faire, de ce qui peut s’écrire sous forme d’algorithme en musique. Il serait très intéressant de pouvoir générer des musiques qui puissent s’écouter comme des musiques de musiciens, car il s’agira de comprendre mathématiquement ce qui provoque les émotions que nous ressentons en écoutant de la musique.

--

--