1. Quel était le problème soumis à la Justice allemande ? L’outil conversationnel d’intelligence artificielle générative ChatGPT aurait mémorisé le texte des chansons de ces artistes avant de le reproduire, presque mot pour mot, sur simple demande de l’utilisateur.
2. Le législateur européen reconnait à l’auteur des droits exclusifs relatifs à l’exploitation de son œuvre. Ces droits lui permettent, entre autres, de s’opposer à toute reproduction de son œuvre, quel que soit le moyen ou le support utilisé.
La question centrale dont a été saisi le Tribunal de Munich était donc de déterminer si le fait, pour ChatGPT, de transmettre sur instructions de ses utilisateurs le texte de certaines chansons constitue un acte enfreignant les droits des auteurs représentés par la GEMA.
OpenAI a-t-il vraiment violé les droits des auteurs représentés par la GEMA ?
3. Pour OpenAI, son modèle de chatbot est tout à fait légal.
La directive européenne 2019/790 ‘sur les droits d’auteur dans le marché unique numérique […]’ prévoit une exception majeure aux prérogatives de l’auteur : la fouille de textes et de données (text and data mining). Cette exception, transposée en droit allemand, autorise toute personne à faire usage d’un processus de recherche informatique automatisée visant à analyser des textes et des données sous une forme numérique afin d’en extraire des données, sous deux conditions :
- les données fouillées doivent être accessibles de manière licite ;
- les titulaires de droits sur les données (en particulier les auteurs) ne doivent pas s’être opposés à la fouille de textes et de données avant qu’elle n’ait lieu.
S’appuyant sur cette directive, OpenAI a tenté, sans y parvenir, de convaincre le Tribunal munichois que l’acte litigieux était couvert par l’exception de text and data mining.
Concrètement, OpenAI ne conteste pas avoir utilisé les textes de chansons protégés par le droit d’auteur pour entrainer son chatbot. Pour le géant de la tech cependant, cet entrainement est couvert par l’exception susmentionnée. La reproduction des textes litigieux sur demande des utilisateurs ne serait qu’une conséquence non voulue de cet entrainement, induite par le comportement des utilisateurs et ne serait donc pas illégale dans son chef.
4. La thèse développée par OpenAI n’a pas été suivie par la juridiction allemande.
Le Tribunal estime que la restitution de passages exacts des textes utilisés lors de l’entrainement prouve l’existence d’un enregistrement et donc d’un acte illicite. Il ne s’agirait pas simplement d’entrainer le modèle de l’intelligence artificielle sur des textes protégés par le droit d’auteur (actes couverts par l’exception), mais bien également de fixer le texte au sein du modèle.
Ce que le Tribunal appelle une mémorisation de données d’entrainement est donc considéré par la juridiction allemande comme illicite. Il en va de même pour la génération des outputs (les textes protégés des artistes représentés par la GEMA) pouvant être enregistrés sur les appareils des utilisateurs.
Les autres arguments soulevés par OpenAI (notamment l’exception de citation ou le fait que les résultats générés par le chatbot auraient été « provoqués » par l’utilisateur et non par OpenAI) ont eux aussi été rejetés.
Un jugement salué… qui ne fait pas l’unanimité
5. En Europe, nombre de médias et de sociétés de gestion collective ont rapidement présenté cette décision comme une victoire majeure pour le respect des droits d’auteur dans le secteur technologique, impliquant une nécessité de changement radical dans la méthode d’entrainement des intelligences artificielles ou, à défaut, l’obligation pour leurs concepteurs de conclure des licences avec les ayants droit.
6. Beaucoup d’auteurs de doctrine (surtout anglophones) émettent toutefois des critiques qui méritent d’être mises en avant, notamment au regard des éléments de preuve produits par GEMA dans le cadre de la procédure.
OpenAI maintient que son modèle conserve uniquement des paramètres statistiques dérivés des données et non les données en tant que telles. Le Tribunal exclut cependant la possibilité que les outputs litigieux résultent de coïncidences ou de lois statistiques. Il apprécie au contraire ces outputs comme la preuve d’une mémorisation des données durant la phase d’entrainement. Pour certains, il s’agit là d’une profonde méprise inhérente à une incompréhension de la technologie liée à l’intelligence artificielle et à une trop grande importance accordée aux pièces produites par GEMA.
Les critiques formulées à l’encontre de ce jugement visent donc principalement une incompréhension du fonctionnement de l’intelligence artificielle dans son processus d’entrainement.
L’impact de la décision
7. Il est d’emblée important de rappeler que les conséquences directes du jugement rendu ne concernent que les textes des chansons expressément visés par la procédure initiée par GEMA.
8. Doit-on s’attendre à des décisions similaires sur le sol européen ?
Pas nécessairement… et c’est peut-être mieux. Le jugement rendu par le Tribunal de Munich dans GEMA v. OpenAI est intéressant sur le plan éthique car il renforce la protection des droits des créateurs face aux nouvelles technologies. Cependant, il ne devrait pas servir de référence tant l’analyse du Tribunal nous parait faussée par une méconnaissance technique de l’intelligence artificielle.
9. L’Union européenne tend à promouvoir l’innovation tout en garantissant un niveau élevé de protection des droits intellectuels. Préserver cet équilibre nécessite, selon nous, que les acteurs du monde juridique se forment aux nouvelles technologies, et ce, afin d’assurer une bonne compréhension des faits qui leur sont présentés et une application correcte des règles de droit.
OpenAI a interjeté appel contre le jugement rendu dans l’affaire en cause. Eu égard aux réactions critiques qui ont suivi le jugement, l’arrêt à intervenir vaudra très probablement la peine d’être lui aussi commenté.