Pour une diversité de l’IA générative « la clé est d’inclure les créatifs »
Table ronde consacrée à l'usage de l'IA générative à We Are French Touch organisé par Bpifrance à la Maison de la Mutualité. Intervenants : Hélène Nguyen-Ban, CEO de Docent Mélanie Lopez-Mallet, data scientist chez Ubisoft Adrien Basdevant, avocat associé chez Entropy, spécialiste data, IA et propriété intellectuelle, et membre du Conseil national du numérique Michael Turbot, responsable stratégie et promotion des technologies, Sony Computer Sciences Laboratories Comme chaque année l’événement We Are French Touch organisé par Bpifrance est l’occasion de réunir les meilleurs experts des industries culturelles et créatives pour questionner les enjeux de l’époque lors de tables rondes très suivies. Les technologies n’échappent pas à la règle : un an après le lancement de ChatGPT, nombreuses sont les questions à émerger sur l’avènement de l’IA générative. On a fait le point.
Inscrivez-vous à la prochaine édition de We Are French Touch en suivant ce lien
L’explosion de l’IA générative avec l’avènement de ChatGPT fait s’interroger les ICC et l’ensemble de l’écosystème de la French Touch sur les enjeux du déploiement de l’IA. Processus créatif, accès à la donnée, uniformisation, propriété intellectuelle, et bien sûr représentation des entreprises et présence des talents français sur les plateformes et les algorithmes. Nombreuses sont les questions et enjeux abordés au cours de cette table-ronde sur « l’usage de l’IA générative, opportunités et menaces pour la création de contenu » modérée par Johanna Tircazes, responsable accompagnement ICC chez Bpifrance.
L’intelligence artificielle générative est en plein boom. Comment l’expliquer ?
Mélanie Lopez-Mallet (MLM) : Il faut imaginer une boite noire, l’algorithme. Cette boite noire stocke une somme d’informations plus ou moins complexes grâce auxquelles on va lui apprendre à exécuter une tâche. Si vous rentrez, par exemple, une photo de votre animal de compagnie, cet algorithme plus ou moins complexe va traduire cette donnée en informations, comme par exemple reconnaître si votre animal est un chat ou un chien. Son boom est surtout lié au lancement de ChatGPT et de sa dimension conversationnelle qui donne l’impression de pouvoir parler et interagir avec la machine. C’est cette anthropomorphisation qui est à la base d’une nouvelle révolution de nos usages informatiques.
Comment se servir de l’IA pour repousser les frontières de la créativité sans cristalliser les éventuelles menaces ?
Michael Turbot (MT) : Dans l’industrie musicale, notre philosophie est de voir comment cette interaction avec cette « boite noire » est la plus pertinente. Elle permet une expertise très technique sur la production de nouveaux sons qu’on va pouvoir rendre plus ludique et productif. Ce mot productif explique bien l’idée d’aller plus vite (…) A force de travailler avec des artistes on s’est rendu compte que leurs processus créatifs avaient changé : ils passent beaucoup plus de temps sur la partie créative grâce à cette nouvelle capacité de créer de nouveaux sons.
MLM : Quand une machine crée, ça ne veut pas dire qu’elle remplace le créatif. Le processus à l’œuvre n’est pas le même, il n’y a pas de démarche créative ou d’intention, puisque l’intention vient de l’humain qui va utiliser cette machine. Donc ce n'est pas la démocratisation de l’IA générative qui peut tuer la créativité. Par exemple, la photo : ce n’est pas parce qu’en un clic on peut saisir un instant que l’on est photographe, et ce n’est parce qu’on a tous un appareil photo sur nos téléphones qu’on fait tous de l’art. C’est bien plus complexe. Est-ce que la machine avilie la création ? Ou est-ce aux artistes d’anoblir les machines en faisant quelque chose d’intéressant avec ?
A quoi ressemblera le contenu de demain ?
Adrien Basdevant (AB) : On va indiscutablement vers un monde où seront générées de plus en plus de données dites « données de synthèse ». Ces données vont elles-mêmes devenir une nouvelle base d’alimentation par rétroaction sur le modèle. Dans un monde d’expériences hybrides, la question est de savoir quelle sera la qualité du contenu qui nourrira les algorithmes ? L’IA générative existe depuis plus de 75 ans et ce qu’on vit actuellement avec ChatGPT est une démocratisation de cette technologie. Doit-on alors parler d’homogénéisation des résultats ? Si aujourd’hui on ne peut pas encore détecter quel outil d’IA générative a servi à générer une image, est-ce que ce sera toujours le cas demain ? Aussi, à quel point faudra t-il afficher la source d’information ? On voit bien que ces questions ne sont plus seulement techniques, c’est un sujet de société. Par exemple dans votre entreprise aurez-vous le droit de vous saisir de ce type d’outil ? Sans le dire à votre hiérarchie ? C’est la question du « shadow IT ». Au lieu de tenir des positions clivantes, ou asymétriquement caricaturales en répondant de manière dichotomique, gardons-nous de préjuger de ces outils. Gardons l’esprit ouvert, participons à cette co-construction.
Comment éviter ce piège de l’homogénéisation du contenu, au profit d’une diversité ?
MLM : La clé est d’inclure les créatifs. Et la première étape est de se confronter à leurs questions, leurs doutes et leurs craintes légitimes. Avoir du recul sur cette technologie, à travers leurs points de vue, est sain. Pour au fur et à mesure arriver à une connaissance qui permet de passer de la peur à la compréhension. Certains créatifs feront le choix « éclairé » de ne pas se servir de l’IA générative, d’autres diront « ça m’intéresse, ça me donne une idée ». Le meilleur moment est quand l’artiste formule lui même son intérêt. Parce qu’à partir de ce moment là, on peut construire un projet, une façon d’utiliser ces technologies. C’est ainsi qu’on parvient à un contenu de qualité.
AB : Si certains éditeurs de contenu décident de ne plus être référencés sur ChatGPT, ils peuvent choisir de désactiver l'indexation de leur contenu. Ce qu'on appelle « opt-out », qui a été fait récemment par le « New York Times » et par différents éditeurs, groupes, médias européens, français notamment. Ce qu'il faut bien comprendre, c'est qu'aujourd'hui dans le pré-entraînement de ces algorithmes, le contenu francophone, par exemple, est déjà sous-représenté. Si tout le monde désactive cette indexation vous pouvez être certain qu’en termes de résultats générés il y aura véritablement très peu de contenu qui aura été entraîné sur des contenus français. Ce qui pose une question très large de diversité du contenu, linguistique, culturelle…
Hélène Nguyen-Ban (HNB) : Chez Docent nous avons fait le choix de ne pas utiliser, comme le font certaines plateformes culturelles ou les réseaux sociaux, des algorithmes de « collaborative featuring » , mais au contraire de reprendre la recherche au tout début avec l’aide d’historiens de l’art, afin de construire des algorithmes capables de reconstituer des clusters d’œuvres qui visuellement se ressemblent, mais aussi des algorithmes capables de « screener » des millions de textes et d’identifier les mots qui qualifient la pratique d’un artiste, pour ensuite faire des connexions profondes entre les artistes et leurs pratiques. L’objectif est de recommander un contenu personnalisé qui ne dépend pas de « comme untel tu as aimé Picasso donc on va te recommander untel » mais d’aller bien au-delà de cette « echo chamber » qui, quand les algorithmes de recommandations fonctionnent de cette façon, finissent par créer une forme d’isolement culturel. Enfin pour justement favoriser la découverte, et pas qu’une découverte uniformisée, on a fait un partenariat avec Goldsmiths, une école d’historiens de l’art et de curateurs d’art contemporain à Londres. Ils nous créent du contenu en ligne sur lequel on peut communiquer en anglais pour les artistes des régions du monde qui n’ont pas de contenu anglophone, afin de les recommander en face ou avec des artistes occidentaux.
Comment réconcilier accès à la donnée et propriété intellectuelle ?
AB : Pour l’utilisateur il y a d’abord une réponse très opérationnelle : faire un « benchmark » des outils disponibles afin de choisir celui qui correspond à son cas d’usage puis de prendre connaissance des conditions générales d’utilisation. C’est peut-être trivial, mais il y a des plateformes et des outils qui permettent d'être détenteur du résultat généré, et d'autres non... Certains vous donnent la propriété du résultat généré, d'autres vous donnent une licence d'utilisation, et dans les deux cas sur des durées déterminées ou non. Puis se pose une question plus théorique : le contenu généré par de l’IA générative est-il protégé par le droit d’auteur ? De Hollywood à Paris le débat se pose de différentes façons. En France, par exemple, un illustrateur qui devait publier une BD créée avec l’aide de « MidJourney » a dû annuler sa parution parce que la maison d'édition craignait des répercussions sur son image. Donc on voit bien que le débat n’est pas uniquement juridique. C’est un débat foisonnant. Et c’est pour cette raison qu’avant de se lancer il faut bien comprendre les chaînes de valeur.
Quand un artiste s’empare d’un outil, il existe en général un va-et-vient entre l’outil et son propre processus créatif. A la fin qui est le créateur ? Quelle valeur attribue t-on à la donnée qui a servi à entraîner le modèle ?
MT : Faire de la musique avec de l’IA, c’est aussi compliqué que faire de la musique avec un ordinateur. Est-ce que l’ordinateur ne sert qu’à associer les pistes ensemble ? Il faut rester vigilant sur cette question de la propriété intellectuelle. Parce qu’il y a une grande différence entre une IA qui sert à générer un morceau dans le style d’untel - et dans ce cas c’est de la contrefaçon -, et utiliser l’IA comme un « sampler ».
AB : Sur le partage de la valeur, la réponse n’est pas que juridique. Elle est pluridisciplinaire parce qu’il y a un aspect économique et un aspect de gouvernance. Du point de vue de l’utilisateur on peut déjà apprendre à paramétrer l’outil : il est possible, dans les paramètres, d’accepter ou non que vos interactions avec un agent conversationnel, des prompts ou des résultats générés par votre interaction, soient ou non réutilisés pour une prochaine phase de réentrainement. Dans le processus créatif, c'est différent : il y aura très certainement moins d'homogénéisation si les prompts sont plus sophistiqués. D'un point de vue macro, je pense qu'il faut faciliter les espaces de discussion pour trouver de nouvelles modalités, et faire en sorte que les développeurs d'outils n'aient pas besoin d'aller voir chaque éditeur de contenu, et inversement. Sinon il n’y aura plus que les plus organisés qui pourront être représentés. Ces modalités ne sont pas propres aux ICC : dans la santé quand l'AP-HP produit des données de santé utilisées par Siemens, par exemple, pour créer un jumeau numérique du cœur, la question est là aussi de savoir à qui appartiennent les données, les algorithmes transformés. Réussir à s’interroger de manière dépassionnée et éviter un enlisement permettrait de bénéficier d'une innovation porteuse.
Récemment un projet de loi a été déposé pour intégrer l’IA dans la propriété intellectuelle. Faut-il réguler ou bien laisser faire les acteurs comme dans le Métavers ?
AB : Souvent, dès qu'y a une nouvelle innovation, on pense que c'est le Far West. Or il existe déjà un arsenal robuste. Ce qui ne veut pas dire qu'il ne doit pas évoluer, mais il faut déjà réussir à appliquer l'existant et sur des choses sur lesquelles il y a une vraie rénovation à apporter. Aux Etats-Unis par exemple avec le « Fair Use ». Faut-il créer le « Fair learning » ? Et réfléchir à la frontière entre le monopole temporaire d'exploitation et la diffusion de la connaissance. J'incite ceux qui font plutôt de la politique et du juridique à être créatifs et à comprendre la « tech » et ses usages. Ne pas juste bannir...
Revivez l'événement We Are French Touch édition 2023
https://www.youtube.com/watch?v=rLVE8IR_zDc&t=34s
Inscrivez-vous à la prochaine édition de We Are French Touch en suivant ce lien