GEMA contre OpenAI : le jugement qui pourrait changer la manière dont l'IA utilise les œuvres protégées.
Gianpaolo Todisco - Associé
La relation entre l'intelligence artificielle et le droit d'auteur est désormais au cœur d'un débat mondial, mais jusqu'à présent, les tribunaux européens ne s'étaient pas clairement prononcés sur une question fondamentale : les plateformes d'intelligence artificielle peuvent-elles utiliser librement des œuvres protégées pour entraîner leurs modèles ?
Avec la récente décision du tribunal de Munich dans l'affaire GEMA contre OpenAI, cette question a enfin trouvé une réponse. Et ce n'est pas du tout la réponse que les géants de la tech espéraient.
Le litige trouve son origine dans les accusations portées par GEMA, la principale société de gestion collective allemande, selon lesquelles OpenAI aurait utilisé des milliers de paroles de chansons protégées par le droit d’auteur pour alimenter ses modèles sans avoir obtenu aucune autorisation. Il ne s'agit donc pas des résultats générés par l'IA, mais de l'étape la plus fondamentale du processus : l'entraînement. OpenAI, comme de nombreuses autres entreprises du secteur, a toujours soutenu que cette étape était purement technique et qu'elle ne relevait donc pas des catégories traditionnelles du droit d'auteur. Une position qui a jusqu'à présent bénéficié d'une certaine tolérance réglementaire, notamment parce que le phénomène était nouveau, insaisissable et difficile à réglementer.
Le tribunal allemand a clairement renversé ce paradigme. L'arrêt affirme en effet que l'entraînement d'un modèle linguistique constitue à tous égards un acte de reproduction de l'œuvre et que, par conséquent, il relève du champ d'application du droit exclusif de l'auteur. Le fait que l'opération soit effectuée par un algorithme, de manière automatisée et à grande échelle, ne change pas la nature juridique de l'activité : si un texte est copié, stocké, analysé ou retravaillé au sein d'un ensemble de données, cette utilisation doit être autorisée.
Mais ce n’est pas tout. Le juge a précisé que, dans cette affaire, on ne pouvait invoquer les exceptions européennes relatives à l’exploration de textes et de données. La directive DSM avait ouvert des possibilités importantes pour la recherche scientifique et, dans certains cas, également pour des utilisations commerciales, mais à une condition essentielle : que l’auteur n’ait pas manifesté sa volonté de réserver ses droits. Or, bon nombre des textes représentés par la GEMA comportaient déjà une mention claire de cette réserve. Selon le tribunal, OpenAI aurait donc dû s’en rendre compte et prendre les mesures nécessaires pour obtenir les licences requises.
Cette décision semble appelée à marquer un tournant historique. Pendant des années, les modèles d’intelligence artificielle ont été développés à partir d’énormes quantités de données trouvées en ligne, souvent sans distinction entre les contenus libres et les contenus protégés. Une pratique justifiée par la complexité technique des processus et par le fait qu’aucune réglementation n’avait jamais réellement abordé cette question de manière directe. Aujourd'hui, cependant, ce « vide » commence à se combler. Et l'arrêt rendu à Munich ne laisse plus de place à des interprétations trop souples : l'utilisation d'œuvres protégées nécessite une licence, exactement comme pour tout autre type de reproduction.
Les conséquences potentielles pour le secteur sont énormes. Les grandes entreprises pourraient être amenées à négocier des accords de licence à grande échelle avec les sociétés de gestion collective nationales et internationales, ouvrant ainsi la voie à un tout nouveau marché de « redevances IA ». Dans le même temps, une plus grande transparence sur les ensembles de données utilisés pour l’entraînement sera inévitable, un sujet qui est resté délibérément opaque pendant des années. Il est possible qu’à l’avenir, les plateformes soient tenues d’indiquer quelles œuvres elles ont utilisées, avec quelles autorisations et dans quelles limites.
Pour les auteurs et les éditeurs, il s'agit clairement d'une victoire importante. Pour la première fois, un tribunal reconnaît que la valeur des œuvres créatives ne s'épuise pas dans leur diffusion publique, mais continue d'exister même dans un contexte inédit tel que l'entraînement d'une intelligence artificielle. Cela pourrait ouvrir la voie à de nouvelles formes de rémunération et à un meilleur contrôle de l'utilisation des contenus dans le monde numérique.
L'affaire GEMA contre OpenAI intervient par ailleurs à un moment où plusieurs juridictions européennes sont saisies de questions similaires et où la Cour de justice de l'Union européenne a été appelée à se prononcer sur des questions connexes. On a le sentiment que nous sommes à l'aube d'une ère entièrement nouvelle en matière de droit d'auteur, où la notion même de « reproduction » devra être réinterprétée à la lumière des technologies d'apprentissage automatique.
Une chose est toutefois déjà claire : l'époque où les IA pouvaient s'entraîner en toute tranquillité en utilisant tout ce qu'elles trouvaient en ligne est révolue. La décision du tribunal de Munich marque l’entrée du droit d’auteur dans les coulisses de l’intelligence artificielle. Et désormais, quiconque souhaite développer des modèles toujours plus puissants devra nécessairement composer avec les auteurs, les éditeurs et les sociétés de gestion collective. Ce n’est plus seulement un problème technique : c’est une question juridique, économique et culturelle qui définit la manière dont la créativité humaine dialogue avec celle de l’intelligence artificielle.