Rechercher

IA et culture : données d’entraînement et propriété intellectuelle

Par Guy-Philippe Wells, Directeur scientifique, LATICCE

Télécharger la version PDF

Pour vous inscrire à la liste de diffusion de la veille technologique sur l’impact de l’IA sur la découvrabilité dans le secteur culturel, ou pour nous faire parvenir vos commentaires et suggestions pour les prochaines éditions, bien vouloir remplir ce court formulaire.

 

Résumé 

La question du rapport entre le développement des modèles d’intelligence artificielle (IA) et les droits de propriété intellectuelle s’est mise à l’avant-plan en Europe et aux États-Unis au cours des derniers mois. Le sujet au cœur des polémiques est l’utilisation de données d’entraînement privées ou protégées par des droits de propriété intellectuelle (PI) pour développer des modèles d’IA. Cette veille présente les deux principaux lieux de débats au cœur de la réflexion sur la régulation de l’IA, l’Europe et les États-Unis, particulièrement dans le secteur de la culture où plusieurs s’inquiètent de ses avancées.

 

Table des matières 

1.  Actualités

1.1 Europe : la voie réglementaire
1.2 États-Unis : la voie judiciaire
1.3 Conclusion

2. Les modèles d’IA pour la création musicale

  1. 2.1 Apprentissage supervisé
  2. 2.2 Réseaux de neurones récurrents (RNN) et LSTM
  3. 2.3 Transformers (GPT, BERT, etc.)
  4. 2.4 Modèles génératifs contradictoires (GAN)
  5. 2.5 Modèles de Markov et autres approches probabilistes
  6. 2.6 IA de style Jukebox (OpenAI)
1. Actualités

Les entreprises de l’intelligence artificielle ont bénéficié d’une grande liberté dans le développement de cette technologie au cours des dernières années. Fruits d’une histoire de 75 ans, les modèles d’IA sont véritablement entrés dans le débat public depuis à peine quatre ou cinq ans, particulièrement avec l’apparition de ChatGPT qui démontre avec éloquence leur puissance.

Dans le secteur culturel, plusieurs entreprises ont développé des modèles d’IA qui permettent d’imiter la créativité humaine en permettant à leurs utilisateurs de créer avec beaucoup de simplicité des œuvres qui ont l’apparence de créations professionnelles. Une simple requête de quelques mots permet en effet de voir surgir du modèle d’IA une chanson qui pourrait bien être diffusée à la radio. Le tout prend moins d’une minute.

Les entreprises de l’IA réussissent ce tour de force grâce à des modèles d’IA entraînés sur des milliers, voire des millions d’œuvres qui permettent à l’IA de classifier les styles et de repérer les caractéristiques afin de les reproduire avec une apparence d’originalité. Cette opération est possible grâce à l’ingestion des données qui entraînent les modèles d’IA dans la plupart des activités créatives telles que la musique, l’image, l’écriture et bien d’autres encore.

Les données d’entraînement constituent la matière première des modèles d’intelligence artificielle (IA). Un modèle d’IA peut être défini comme étant une construction mathématique qui génère une déduction ou une prédiction à partir de données d’entraînement, sans intervention humaine. La construction mathématique consiste en un ou plusieurs algorithmes qui effectuent les calculs nécessaires à la déduction ou à la prédiction à partir d’un entraînement sur une série de données pertinentes. Ainsi, on peut voir les algorithmes comme étant la structure du modèle et les données d’entraînement comme en étant la matière.

Les œuvres utilisées pour l’entraînement des modèles d’IA sont généralement protégées par des droits de propriété intellectuelle (PI). La plupart des chansons populaires du répertoire mondial sont protégées par ces droits et une bonne partie d’entre elles sont la propriété des multinationales du disque, Universal, Sony et Warner qui occupent plus du ¾ du marché mondial.

Les propriétaires des droits de PI font valoir que les entreprises de l’IA utilisent leurs chansons sans leur consentement. Ces dernières sont restées assez mystérieuses sur leurs pratiques de développement des modèles d’IA jusqu’aux derniers mois. Bénéficiant du flou juridique dans l’encadrement de ces activités qui étaient inédites jusqu’à tout récemment, elles ont pu développer leurs modèles d’IA sans embûches. Maintenant qu’apparaissent les nouvelles avenues de création musicale qu’elles permettent et que se définissent des modèles d’affaires pour mettre en valeur ces technologies, des questions se posent sur la répartition de cette valeur entre les différents acteurs qui la rende possible.

De façon générale, les États sont sollicités pour encadrer les nouvelles activités des entreprises de l’IA, particulièrement sur la question de la récolte et de l’analyse des données d’entraînement utilisées pour développer les modèles d’IA. L’Union européenne a pris l’initiative en adoptant cette année l’Artificial intelligence Act [1] qui a été publié le 12 juillet 2024. 

Aux États-Unis, différentes initiatives sont mises de l’avant pour réglementer ce secteur. La Maison-Blanche a présenté un projet de Déclaration des droits de l’IA [2], qui propose des orientations concernant l’accès et l’utilisation équitables des systèmes d’IA. La Déclaration des droits de l’IA fournit cinq principes et pratiques associées pour aider à guider la conception, l’utilisation et le déploiement de « systèmes automatisés » : 1) des systèmes sûrs et efficaces ; 2) la protection contre la discrimination algorithmique ; 3) la confidentialité des données ; 4) la publication avis et explication ; et 5) la possibilité pour les individus de se désengager (opting-out) d’un système automatisé.

Le projet de régulation de la Maison-Blanche est discuté à Washington et plus de 40 États américains ont déposé en 2023 des projets de loi sur l’encadrement de l’IA. Les multinationales du disque ont décidé d’intervenir dès maintenant afin de protéger leurs intérêts économiques. Elles ont utilisé la voie judiciaire pour le faire, particulièrement les lois relatives à la protection de la PI.

  1. 1.1 Europe : la voie réglementaire

Un groupe d’entreprises, de chercheurs et d’institutions, dont META et Spotify, a publié en septembre une publicité dans le Financial Times réclamant plus de certitudes sur le cadre réglementaire de l’IA en Europe. Intitulée « Europe needs regulatory certainty on AI » [3], la publicité fait état de récentes interventions du Comité européen de protection des données (EDBP) qui ont créé beaucoup d’incertitudes quant à la nature des données qui peuvent être utilisées pour entraîner des modèles d’IA. Le groupe réclame des règles claires, appliquées avec constance, qui permettent l’utilisation des données européennes.

Le 12 juillet 2024, l’Union européenne (UE) a publié le « Artificial intelligence Act », présentant le premier cadre légal de l’IA s’appliquant à l’ensemble de ses membres. La loi est entrée en vigueur le 1er août 2024 et la plupart de ses dispositions prendront effet le 2 août 2026.

L’objectif poursuivi par l’UE est de « (…) garantir que les systèmes d’IA utilisés dans l’UE soient sûrs, transparents, traçables, non discriminatoires et respectueux de l’environnement. Les systèmes d’IA devraient être supervisés par des personnes plutôt que par l’automatisation, afin d’éviter des conséquences néfastes. » [4]

La loi touche plusieurs activités liées à l’IA. Par exemple, la loi impose des restrictions aux cas d’utilisation de l’IA qui présentent un risque élevé pour les droits fondamentaux des personnes, comme dans les soins de santé, l’éducation et la police. Ceux-ci seront interdits d’ici la fin de l’année. 

Pour ce qui nous intéresse de près sur la question des données d’entraînement, la loi prévoit que les entreprises d’IA qui développent des « modèles d’IA à usage général », tels que des modèles de langage, devront également créer et conserver une documentation technique montrant comment elles ont construit le modèle, comment elles respectent la loi sur le droit d’auteur, et publier un résumé accessible au public des données utilisées dans la construction du modèle d’IA.

La loi oblige les entreprises à mettre en œuvre une politique de respect du droit d’auteur de l’UE. Le droit d’auteur s’applique au domaine de l’IA, à la fois à l’utilisation d’œuvres protégées par le droit d’auteur à des fins d’entraînement des algorithmes et aux résultats générés par l’IA qui contreviendraient aux dispositions de protection de la PI.

La loi sur l’IA comprend une obligation de transparence des données d’entraînement. Les entreprises doivent rendre public un résumé suffisamment détaillé du contenu utilisé pour l’entraînement, en tenant compte de la nécessité de protéger les informations commerciales confidentielles.

Pour l’utilisation d’œuvres protégées par le droit d’auteur à des fins d’entraînement d’un modèle d’IA, la loi sur l’IA mentionne explicitement que les entreprises doivent respecter les droits de retrait effectués par les titulaires de droits en vertu de l’exception Text and Data Mining ou TDM de l’art. 4(3) de la directive (UE) 2019/790. Cette exception implique que lorsqu’un retrait a été effectivement déclaré sous une forme lisible par une machine ou par une organisation, le contenu visé ne peut pas être récupéré pour l’entraînement de l’IA. 

Il s’agit d’un grand changement par rapport au statu quo, où les entreprises technologiques gardent le secret sur les données intégrées à leurs modèles, et nécessitera une refonte des pratiques désordonnées de gestion des données du secteur de l’IA. 

L’AI Act, tout comme certaines réglementations nationales de membres de l’UE, rendent plus complexe la tâche de l’utilisation des données d’entraînement générées en Europe. Meta a déclaré au printemps 2024 qu’elle retardait ses efforts pour former les grands modèles linguistiques de l’entreprise en utilisant le contenu public partagé par les utilisateurs sur Facebook et Instagram dans l’Union européenne à la suite d’une demande de la Commission irlandaise de protection des données.

L’entreprise a exprimé sa déception de devoir suspendre ses projets d’IA, affirmant qu’elle avait pris en compte les commentaires des régulateurs et des autorités de protection des données de la région.

Le problème est le projet de Meta d’utiliser les données personnelles pour entraîner ses modèles d’intelligence artificielle (IA) sans demander le consentement explicite des utilisateurs, mais en s’appuyant plutôt sur la base juridique des « intérêts légitimes » pour le traitement des données propriétaires et de tiers dans la région.

Les pratiques des entreprises de l’IA se trouvent donc bousculées par la réglementation européenne. Le rapport de force entre les entreprises et les autres acteurs n’est pas encore déterminé, l’application effective de la loi restant à être démontrée.

  1.  1.2 États-Unis : la voie judiciaire

Un important procès pour l’avenir de la création musicale à l’aide de l’IA est en cours aux États-Unis. Les trois multinationales du disque, Universal, Sony et Warner, ont déposé le 24 juin 2024 deux plaintes pour violation de propriété intellectuelle contre les entreprises Suno et Udio [5]. Ces deux entreprises sont les principaux acteurs de la récente mise en œuvre de sites internet offrant aux usagers la possibilité de créer de la musique ou des chansons à partir d’une simple requête.

Les plaignants estiment que Suno et Udio ont utilisé illégalement les œuvres dont ils sont propriétaires afin de développer leurs modèles d’IA :

« Les principes fondamentaux du droit d’auteur stipulent que la copie d’enregistrements sonores protégés dans le but de développer un produit d’IA nécessite l’autorisation des titulaires de droits. Dans le cas contraire, ces produits d’IA éroderont la valeur des œuvres artistiques qui constituent les matières premières essentielles qui leur permettent de fonctionner en premier lieu. S’ils ne sont pas arrimés aux contraintes juridiques existantes et de longue date, ces produits pourraient supplanter, plutôt que de soutenir, la véritable créativité humaine. » [6] (Plaintes des plaignants, p.2)

Pour faire la démonstration de l’utilisation d’œuvres protégées pour entraîner les modèles d’IA, les multinationales du disque ont utilisé les services de Suno et d’Udio pour générer des chansons à partir de requêtes précises qui ont produit des chansons très proches des œuvres protégées par la PI. À l’écoute de plusieurs d’entre elles, on peut en effet constater qu’elles se rapprochent beaucoup de l’œuvre originale, mais il est difficile de voir en quoi elles pourraient constituer une menace, les succédanés étant de qualité assez basse. L’objectif des multinationales semble plutôt être de faire la preuve de l’utilisation de leur propriété pour entraîner les modèles d’IA, ce qui semble évident.

La principale préoccupation exposée par les multinationales du disque est le risque d’érosion de ses revenus par la nouvelle concurrence que représentent les services d’IA :

« (…) les copies non autorisées de Suno érodent la valeur et l’intégrité des enregistrements sonores protégés par le droit d’auteur des plaignants avec un impact rapide et dévastateur. Le service de Suno génère de la musique à une vitesse et à une échelle telles qu’il risque d’envahir le marché avec de la musique générée par l’IA et de dévaloriser et de remplacer de manière générale les œuvres créées par l’homme. Suno compte déjà plus de 10 000 000 d’utilisateurs qui génèrent des fichiers musicaux à l’aide de son produit, certaines productions totalisant plus de 2 000 000 de flux. Ces fichiers musicaux numériques ont été mis à la disposition du public — certains se retrouvent déjà sur les principaux services de streaming — et concurrencent les enregistrements sonores protégés par le droit d’auteur qui ont permis leur création ; pourtant, Suno n’a demandé aucune autorisation et n’accorde aucun crédit ou compensation aux artistes humains ou aux autres titulaires de droits dont les œuvres ont alimenté leur création. ». (Plaintes des plaignants, p.5)

Faisant preuve de leur retenue habituelle, les multinationales du disque réclament 150 000 $ par œuvre utilisée pour l’entraînement du modèle d’IA de Suno. Si l’entreprise a utilisé des centaines de milliers, voire des millions d’œuvres pour cet entraînement, on comprend que le montant réclamé peut s’avérer gigantesque.

Suno admet qu’elle a utilisé des œuvres protégées dans l’entraînement de son modèle d’IA. Dans sa réponse à la plainte déposée, elle présente les choses de la manière suivante :

« Personne n’est propriétaire des styles musicaux. Développer un outil permettant à un plus grand nombre de personnes de créer de la musique, en analysant scrupuleusement les éléments constitutifs des différents styles, est une utilisation équitable par excellence en vertu de la doctrine du droit d’auteur. (…) La vision contraire des plaignants est fondamentalement incompatible avec la loi et ses valeurs sous-jacentes. (…) Chaque fois que la question a été posée — et elle l’a été à maintes reprises — la conclusion ultime a été que la réalisation d’une copie “intermédiaire” d’une œuvre protégée, dans le but de générer des résultats ne contrevenant pas à loi, est autorisée et non punissable. » (Réponse de Suno à la plainte, p.13)

Suno admet qu’elle a utilisé des dizaines de millions d’enregistrements afin d’établir une compréhension statistique de leur structure. Elle admet avoir copié temporairement des œuvres protégées afin de créer son modèle d’IA et que cette utilisation des œuvres protégées est couverte par l’utilisation équitable, le « fair use » en anglais, qui est défini dans la loi sur le droit d’auteur.

L’usage équitable (fair use) est une doctrine juridique présente dans la loi américaine qui promeut la liberté d’expression en autorisant l’utilisation sans licence d’œuvres protégées par le droit d’auteur dans certaines circonstances. L’article 107 de la Loi sur le droit d’auteur fournit le cadre légal permettant de déterminer si quelque chose est un usage équitable et identifie certains types d’utilisations — telles que la critique, le commentaire, le reportage d’actualité, l’enseignement, les études et la recherche — comme exemples d’activités pouvant être qualifiées d’usages équitables. 

Suno prétend qu’en vertu de la loi sur le droit d’auteur, il est considéré comme un usage équitable de faire une copie d’une œuvre protégée dans le cadre d’un processus technologique d’arrière-plan, invisible au public, dans le but de créer un nouveau produit qui ne contrevient pas dans sa nature à cette loi.

  1. 1.3 Conclusion

Il est indéniable que Suno a utilisé des œuvres protégées par des droits de PI sans demander l’autorisation aux propriétaires. La principale question à trancher est de savoir si cette utilisation est équitable ou non. Il apparaît nécessaire ici de rappeler que les fondements des lois sur le droit d’auteur n’étaient pas d’accorder un droit de propriété équivalent à celui de la propriété privée. Il s’agit d’accorder un privilège à une personne ou à une organisation afin de favoriser la créativité qui bénéficie à l’ensemble de la société. C’est une des raisons qui explique la durée limitée de la protection de la PI. Il y a une part d’encouragement à l’intérêt privé, mais aussi une considération de l’intérêt public [7].

Les multinationales du disque ont les moyens de défendre avec vigueur leurs intérêts économiques. Leur réaction dans ce cas-ci nous rappelle la lutte extrême qu’elles ont menée contre le partage gratuit de la musique au début des années 2000. Elles ont alors poursuivi des étudiants et des personnes âgées pour des centaines de milliers de dollars. Finalement, la technologie qui permettait le partage gratuit a été à la base des entreprises d’écoute en ligne telles que Spotify, dont les multinationales du disque tirent aujourd’hui la majeure partie de leurs revenus.

Un jugement qui donnerait entièrement raison aux multinationales du disque placerait les entreprises de l’IA dans une position de négociation difficile à tenir face aux premières. La question de la légalité de la copie temporaire est difficile à trancher. Si la copie n’a pas l’objectif de reproduire l’œuvre, mais bien d’en comprendre la structure afin d’être capable d’en produire de nouvelles sur la base de cette compréhension, cette pratique s’apparente à ce que font tous les artistes lorsqu’ils s’inspirent de leurs prédécesseurs pour développer leur propre style musical. La création n’est jamais en vase clos. Il n’en demeure pas moins que les entreprises de l’IA puisent dans le travail de millions d’artistes et de producteurs afin de créer un modèle d’affaires dont ils bénéficieront. On peut comprendre le désaccord des artistes et des producteurs qui voient une source potentielle de revenus leur échapper alors que leur travail est à la base du modèle d’affaires des entreprises de l’IA.

Avant le dépôt de la plainte, les multinationales du disque ont approché les entreprises de l’IA afin de voir de quelle manière ils pourraient collaborer. La plainte nous apparaît comme une tentative de développer un rapport de force dans d’éventuelles négociations sur le futur de ces nouveaux marchés qui se développent.

D’un point de vue économique, l’utilisation de millions d’œuvres pour l’entraînement du modèle d’IA fait en sorte qu’il sera bien difficile d’accorder une importante valeur à l’utilisation de chacune d’entre elles. Il serait sûrement légitime qu’une part des revenus des entreprises de l’IA soit versée aux artistes qui ont écrit les œuvres qui permettent la création d’œuvres par l’IA. Ces revenus ne devraient toutefois pas être suffisamment élevés pour empêcher la rentabilité des entreprises de l’IA et bloquer l’innovation dans ce secteur qui en est encore à sa naissance. 

D’autres complications sont issues du droit de retrait des données d’entraînement qui apparaît comme une norme qui s’étendra dans les différentes réglementations sur l’IA. Qu’adviendra-t-il des modèles d’IA existants qui ont utilisé des œuvres protégées pour leur entraînement lorsque les propriétaires de celles-ci réclameront leur retrait?

Il est aujourd’hui difficile de mesurer quel sera l’impact de ces nouveaux outils pour le public. Il ne nous apparaît pas aujourd’hui qu’une solution simple puisse être appliquée afin de satisfaire tous les intérêts concurrents.

Nous sommes d’avis que l’innovation ne devrait pas être paralysée par les intérêts économiques d’un oligopole qui fait souvent preuve de bien peu d’attention aux effets délétères de ses activités sur la création musicale. Par contre, il nous apparaît que les artistes et les producteurs dont les œuvres sont utilisées pour l’entraînement des modèles d’IA devraient pouvoir bénéficier des sommes que versent leurs usagers. Une forme d’entente collective telle que celles qui existent déjà dans l’industrie de la musique apparaît comme une voie à suivre. Ainsi, les entreprises de l’IA ne devraient pas être les seules à profiter des revenus générés par leurs activités basées sur la créativité des artistes.

Le procès entre Suno, Audio et les multinationales du disque aura des répercussions importantes sur l’avenir de l’industrie mondiale de la musique. Comme ses principaux acteurs sont tous américains, les modalités qui seront définies à la conclusion de ce procès risquent d’être celles qui deviendront la norme mondiale. 

Le processus de modélisation de la musique par l’IA se retrouvant également utilisé dans plusieurs autres types d’activités créatives, il est probable que le jugement de cette cause ait des impacts dans l’ensemble des industries créatives. La configuration idéale des droits et responsabilités de chacun n’est pas simple à établir. D’une part, les artistes et le producteurs se sentent menacés par la nouvelle concurrence de l’IA et cherchent à faire valoir leurs droits lorsque ces modèles sont rendus possibles grâce à leur créativité et leurs investissements. Ensuite, les entreprises de l’IA sont capables de développer de nouvelles technologies qui ont le potentiel d’ajouter de la valeur à la vie des citoyens en permettant une créativité jusqu’à maintenant possible que pour quelques-uns. 

Nous sommes encore à la genèse de l’utilisation de ces technologies et il est aujourd’hui difficile de dire s’il s’agit de l’amorce d’une révolution techno-culturelle ou si leur impact ne sera celui que d’un outil de plus mis à la disposition de la créativité humaine, qui en modifiera la trajectoire sans pour autant en modifier l’essence.

  1. 2. LES MODÈLES D’IA POUR LA CRÉATION MUSICALE

L’intelligence artificielle (IA) utilise plusieurs techniques pour créer des chansons. Cela dépend du type d’IA et de son architecture, mais les méthodes les plus courantes reposent sur des réseaux de neurones profonds, notamment les réseaux de neurones récurrents (RNN) et les transformers. Voici un aperçu des principales techniques utilisées :

2.1 Apprentissage supervisé

Dans ce cadre, l’IA est entraînée sur de grandes quantités de données musicales. L’algorithme apprend les relations entre différents éléments musicaux comme la mélodie, l’harmonie, le rythme et les paroles. Les étapes principales sont :

  • Collecte des données : Des milliers, voire des millions de chansons sont utilisées pour entraîner l’IA.
  • Prétraitement : Les chansons sont décomposées en données numériques (notes, accords, rythmes).
  • Entraînement : L’IA apprend des motifs récurrents dans ces données, et peut les utiliser pour générer de nouvelles séquences musicales ou paroles.
2.2 Réseaux de neurones récurrents (RNN) et LSTM

Les RNN et leur variante LSTM (Long Short-Term Memory) sont souvent utilisés pour générer de la musique et des paroles, car ils sont capables de traiter des séquences temporelles. En musique, cela signifie qu’ils peuvent générer des mélodies ou des paroles en tenant compte des notes ou des mots précédents. Par exemple :

  • Génération de mélodies : l’IA génère note par note, en se basant sur les notes précédentes pour créer des mélodies cohérentes.
  • Génération de paroles : l’IA peut générer des lignes de texte en fonction de celles qui précèdent, en respectant une certaine structure grammaticale ou rythmique.
2.3 Transformers (GPT, BERT, etc.)

Les architectures de type transformer, telles que celles utilisées dans les modèles GPT (comme GPT-3), sont également très puissantes pour générer des chansons. Elles permettent de capturer des relations à long terme dans les séquences, ce qui est crucial pour créer des chansons cohérentes. Elles sont plus efficaces que les RNN pour traiter de grandes quantités de données.

  • Génération de paroles : les modèles comme GPT-3 peuvent générer des paroles en utilisant des contextes plus larges, prenant en compte toute la structure d’une chanson (vers, refrain, etc.).
  • Musique et parole ensemble : les transformers peuvent être utilisés pour générer simultanément musique et paroles, en maintenant une cohérence entre les deux.
2. 4 Modèles génératifs contradictoires (GAN)

Les GANs (Generative Adversarial Networks) peuvent également être utilisés pour la création musicale. Un modèle GAN se compose de deux réseaux : un générateur et un discriminateur. Le générateur crée de la musique, et le discriminateur évalue si cette musique ressemble à celle de vrais compositeurs. Le générateur s’améliore progressivement pour tromper le discriminateur, produisant ainsi des mélodies de plus en plus réalistes.

  • Création de musique : Le GAN apprend à générer des musiques qui imitent des styles existants ou en créer des totalement nouveaux.
  • Mélange de styles : Les GAN peuvent aussi être utilisés pour mélanger différents genres de musique afin de créer des combinaisons originales.
2.5 Modèles de Markov et autres approches probabilistes

Certains modèles plus simples, comme les chaînes de Markov, peuvent être utilisés pour la génération musicale. Ces modèles se basent sur la probabilité de transition entre différentes notes ou mots, créant ainsi une séquence en fonction de ce qui est le plus probable à chaque étape.

  • Génération musicale basique : Ces modèles sont utilisés pour générer des mélodies relativement simples en fonction des transitions observées dans les données d’entraînement.
2.6 IA de style Jukebox (OpenAI)

Un exemple notable est Jukebox, une IA d’OpenAI capable de générer de la musique avec des paroles dans un style spécifique, par exemple en imitant des artistes connus. Cette IA repose sur une combinaison de techniques avancées de transformation et d’apprentissage profond pour analyser et générer de la musique avec une grande fidélité aux styles des chansons d’origine.

Applications concrètes :

  • Création de mélodies : IA comme Magenta de Google permet de générer des mélodies à partir de quelques notes.
  • Écriture de paroles : Des modèles comme GPT-3 ou LyricStudio sont utilisés pour générer des paroles originales, que ce soit pour de la pop, du rap ou même des chansons de style classique.
  • Génération automatique de styles : Certains outils permettent de composer dans le style d’un compositeur ou d’un genre spécifique, en utilisant les caractéristiques apprises sur les données d’entraînement.

Ces techniques montrent comment l’IA peut non seulement imiter des compositions humaines, mais aussi proposer des créations originales en combinant des éléments musicaux d’une manière nouvelle et parfois surprenante.


[1] https://artificialintelligenceact.eu/ 

[2] https://www.whitehouse.gov/ostp/ai-bill-of-rights/

[3] Pour consulter la publicité :  https://www.artificialintelligence-news.com/news/tech-industry-giants-urge-eu-streamline-ai-regulations/

[4] Union européenne. 2024. https://www.europarl.europa.eu/topics/en/article/20230601STO93804/eu-ai-act-first-regulation-on-artificial-intelligence

[5] Les plaignants sont UMG Recordings, Inc., Capitol Records, Llc, Sony Music Entertainment, Atlantic Recording Corporation, Atlantic Records Group Llc, Rhino Entertainment Llc, The All Blacks U.S.A. Inc., Warner Music International Services Limited, and Warner Records Inc. Les plaintes contre Suno et Udio sont l’objet de procès distincts. Le premier se tient dans le district du Massachusetts et le deuxième dans le district de New York. Le contenu des deux plaintes est similaire.

[6] Traduction libre

[7] Pour se convaincre de cette intention, il suffit de lire Jefferson au moment de la réflexion sur les orientations à donner à la protection de la PI aux États-Unis: « If nature has made any one thing less susceptible than all others of exclusive property, it is the action of the thinking power called an idea, which an individual may exclusively possess as long as he keeps it to himself; but the moment it is divulged, it forces itself into the possession of every one, and the receiver cannot dispossess himself of it… Inventions then cannot, in nature, be a subject of property. Society may give an exclusive right to the profits arising from them, as an encouragement to men to pursue ideas which may produce utility, but this may or may not be done, according to the will and convenience of the society, without claim or complaint from anybody. » (Jefferson,The Founders‘ Constitution. Vol. 3, Article 1, Section 8, Clause 8, Doc. 12)


Cet article est le résultat d’une collaboration entre LATICCE-UQAM, CEIMIA et Mitacs. 

Les opinions exprimées et les arguments avancés dans cette veille demeurent sous l’entière responsabilité du rédacteur.

  1. Direction scientifique : Michèle Rioux, directrice du LATICCE
  2. Rédaction : Guy-Philippe Wells, directeur scientifique du LATICCE
  3. Coordination : Janick Houde et Arnaud Quenneville-Langis du CEIMIA
  4. Révision : Mathieu Marcotte du CEIMIA
  5. Centre d’expertise international de Montréal en intelligence artificielle (CEIMIA)
  6. 7260 Rue Saint-Urbain, Montréal, QC H2R 2Y6, suite, 602, CANADA. Site web: www.ceimia.org 
  7. Centre d’études sur l’intégration et la mondialisation (CEIM)
  8. UQAM, 400, rue Sainte-Catherine Est, Pavillon Hubert-Aquin, bureau A-1560, Montréal (Québec) H2L 2C5
  9. CANADA. Téléphone : 514 987-3000, poste 3910 / Courriel: ceim@uqam.ca / Site web: www.ceim.uqam.ca