Les IA génératives sont capables de générer des images artistiques, des textes, voire de la musique. A ce titre elles suscitent bien des controverses en raison de l’utilisation massive d’œuvres pour leurs apprentissages sans le consentement de leurs auteurs. Ce fonctionnement soulève des questions juridiques inédites. C’est un défi de premier ordre pour le droit de la propriété intellectuelle car cette révolution technologique questionne la créativité humaine et les droits des créateurs.
L’intelligence artificielle générative
L’IA exploite les ordinateurs et les machines pour imiter les capacités de résolution de problèmes, de prise de décision de l’esprit humain. L’intelligence artificielle générative (IAg) est un type d’IA capable de générer du texte, des images ou d’autres médias en réponse à des invites (ou prompts en anglais).
Alors que la plupart des formes d’IA sont conçues pour réagir à des données, l’IA générative, elle, « crée ». Elle ne se contente pas de prédire, elle « imagine ». C’est cette distinction entre création et prédiction qui la rend si particulière et fascinante.
Les principes de fonctionnement
L’IAG s’appuie des algorithmes avancés et les techniques de Machine learning et Deep learning pour générer de nouvelles données à partir d’exemples existants, de manière autonome. Elle observe et analyse des œuvres pour s’approprier leurs spécificités, leur unicité : les couleurs, les formes, les rythmes, les styles, les motifs, les structures. Elle apprend en s’inspirant et en imitant les œuvres.
L’IAg a donc besoin d’assimiler de très nombreuses données exemples pour créer ses modèles. Plus elle apprend, plus elle devient puissante et pertinente. Mais l’IAg ne fait pas qu’imiter. Elle mixe les les éléments et principes appris pour générer quelque chose de nouveau. Cette capacité à produire de « l’inédit » est ce qui donne à l’IA générative une forme de créativité.
La captation des données
Pour alimenter les IAg en données, il existe Internet et les méthodes de web-scraping. Le web-scraping consiste à extraire automatiquement des données via des scripts ou des logiciels spécifiques. Capter des données et les assimiler est au cœur du fonctionnement de l’IA.
Au-delà du questionnement créatif de l’IAG, cette captation de données constitue un défi majeur pour de nombreux titulaires de droits. Cette captation et « exploitation » est souvent réalisée sans leur autorisation et à leur insu ce qui soulève de réelles problématiques.
Le cadre juridique
Des tensions sont apparues entre le droit et l’innovation du fait de l’utilisation non autorisées d’œuvres, et au-delà de données personnelles. Par principe, protéger strictement les œuvres originales conduirait inévitablement à établir un cadre juridique fort dont l’application pourrait contraindre la progression de l’innovation.
Le contexte
Pour qu’une création puisse être protégée par le droit d’auteur, elle doit être originale et porter l’empreinte personnelle de son auteur, elle doit être « caractérisée ». C’est cette originalité qui confère à l’auteur un monopole sur son œuvre. En toute logique, l’auteur de l’œuvre doit être une personne physique, pour détenir des droits moraux et patrimoniaux sur sa création.
Si la loi favorise la créativité en offrant une protection par le droit d’auteur aux œuvres originales, elle manque de précisions lorsque ces œuvres sont utilisées en masse comme données d’entraînement pour l’IA. C’est pourquoi le législateur est intervenu afin de protéger les droits d’auteur face à la captation massive des œuvres diffusées publiquement en ligne. La directive européenne 2019/790 du 17/04/2019 définit des lignes directrices, conciliant à la fois la nécessité de faire avancer l’IA et le respect des droits d’auteur.
Ce premier texte législatif autorise les éditeurs et utilisateurs d’outils de web-scraping à extraire des œuvres et d’autres objets protégés, et à les compiler dans des bases de données. L’objectif visé est de favoriser l’essor de l’IA par l’apprentissage, tout en limitant l’exercice de ce droit pour protéger les auteurs.
En application de cette directive européenne le droit français prévoit deux exceptions au droit d’auteur. Le Code de la propriété intellectuelle pose les conditions de mise en œuvre de ces deux exceptions liées à la fouille de texte, en anglais Data Mining.
- Des copies ou reproductions numériques d’œuvres auxquelles il a été accédé de manière licite peuvent être réalisées sans autorisation des auteurs en vue de fouilles de textes et de données menées à bien aux seules fins de la recherche scientifique par les organismes de recherche, les bibliothèques accessibles au public, les musées, les services d’archives ou les institutions dépositaires du patrimoine cinématographique, audiovisuel ou sonore, ou pour leur compte et à leur demande par d’autres personnes, y compris dans le cadre d’un partenariat sans but lucratif avec des acteurs privés.
- Des copies ou reproductions numériques d’œuvres auxquelles il a été accédé de manière licite peuvent être réalisées en vue de fouille de textes et de données menées à bien par toute personne, quelle que soit la finalité de la fouille, sauf si l’auteur s’y est opposé de manière appropriée, notamment par des procédés lisibles par machine pour les contenus mis à la disposition du public en ligne. (art. L.122-5-3-III du code de la PI).
Dès lors, sans consentement de l’auteur sur la reproduction de son œuvre, les éditeurs d’IA générative qui l’utilise malgré le refus explicite de son auteur sont donc passibles d’une sanction pour contrefaçon.
L’exercice du droit d’opposition semble simple, mais complexe en réalité. En effet, il faut pouvoir contrôler les diffusions multiples des contenus sur la toile et gérer les contenus déjà utilisés avant que les titulaires de droits soient informés ou aient pu exercer leur droit d’opposition. Au surplus, pouvoir accéder aux contenus des bases de données mis en œuvre par les éditeurs d’IA.
Les enjeux de la réglementation de l’IA
En l’absence d’une concertation internationale, les pays qui investissent dans l’IA progressent indépendamment afin de trouver un équilibre entre le soutien à l’innovation et la sauvegarde des droits et libertés des individus. La réglementation de l’IA devient un enjeu mondial prioritaire.
Actuellement, l’Union européenne finalise un texte sur la réglementation de l’IA. En France, le 12 septembre 2023, des députés ont déposé à l’Assemblée nationale la proposition de loi n° 1630 visant à encadrer l’intelligence artificielle par le droit d’auteur.
Cette proposition de loi contient 4 articles :
- Art. 1 : Elle affirme l’application du droit d’auteur dans l’intégration et l’utilisation d’œuvres par l’IA.
- Art.2 : Elle définit les principes de propriété des droits d’une œuvre réalisé par une IA sans intervention humaine directe et la gestion collective des droits associés.
- Art. 3 : Elle impose que soit mentionnée « œuvre générée par IA » ainsi que le nom des auteurs des œuvres ayant permis d’aboutir à une telle œuvre.
- Art. 4 : Elle introduit une taxe pour la valorisation de la création au profit des organismes de gestion collective quand l’origine des œuvres utilisées par l’IA ne peuvent être déterminées.
“Si cette proposition de loi est un premier pas pour tenter de répondre aux enjeux sur la protection des droits des auteurs face aux intelligences artificielles génératives, elle intègre par ailleurs l’évolution technologique dans le domaine de la création artistique. Ce texte sera certainement appelé à évoluer avant d’être définitif et adopté.