« La ghiblification ne concerne pas vraiment le Studio Ghibli. » Mon voisin Totoro / Studio Ghibli

« Les GPU d’OpenAI fondent », a annoncé le PDG Sam Altman jeudi dernier alors qu’il s’efforçait d’éviter une apocalypse ChatGPT. Qu’est-ce qui a déclenché l’arrêt soudain ? Ni une cyberattaque, ni une prise de contrôle à la manière de Terminator. C’était plutôt des légions d’utilisateurs se transformant en personnages d’anime de Studio Ghibli, inspirés par le studio japonais derrière Le Voyage de Chihiro et Princesse Mononoké.
Tout a commencé mardi dernier lorsque un entrepreneur technologique relativement obscur, Grant Slatton, a téléchargé une photo de famille apparemment ordinaire sur le nouveau générateur d’images de ChatGPT-4o pour la « Ghiblifier ». Inondée de ciels pastel et de sourires doux, l’image qu’il a produite était l’encapsulation parfaite de l’esthétique du studio.
Le post est devenu viral, amassant plus de 43 millions de vues en seulement quelques jours et provoquant une éruption de contenu Ghibli. Soudain, aucun meme ne pouvait échapper à la Ghiblification. Et une réaction rapide a suivi. Certains critiques ont visé les ambiguïtés évidentes de la propriété intellectuelle. D’autres ont diffusé des extraits d’un documentaire de 2016 où le fondateur de Ghibli, Hayao Miyazaki, déclarait que l’animation par IA était « une insulte à la vie elle-même ».
Cependant, cette Ghiblification rapide annonce un avenir beaucoup plus sombre, et surtout plus étrange, que de simples violations de propriété intellectuelle et dégradations artistiques. Dans la critique technologique, il est à la mode de contraster deux dystopies : Pékin contre Las Vegas. La première est bien connue. Elle prédit un avenir orwellien de 1984 de surveillance de masse et de contrôle de la pensée, propulsé par des logiciels espions alimentés par l’IA. Cela est mieux caractérisé par les avertissements du député républicain Mike Gallagher d’une dystopie de surveillance « orwellienne » exportée par le Parti communiste chinois.
En revanche, la dystopie de Las Vegas envisage un avenir où nous sommes distraits par le divertissement, comme prévu par Aldous Huxley dans Le Meilleur des mondes. Cette vision, proposée par Neil Postman dans son classique de 1985 Amusing Ourselves to Death, présente un avenir où « Big Brother ne nous regarde pas, par son choix. Nous le regardons, par le nôtre. Il n’y a pas besoin de gardiens, de portes ou de ministères de la vérité. » C’est un avenir de capitalisme limbique où nous sommes inondés par le soma addictif des plaisirs de Las Vegas. Les livres n’ont pas besoin d’être interdits, car tout le monde est trop occupé à faire défiler, à manger de la malbouffe, à jouer, à jouer à des jeux vidéo et à regarder du porno.
Cependant, l’essor de la Ghiblification présente un troisième avenir technologique, non pas de Pékin ou de Las Vegas — mais de Tokyo. Ce n’est pas un avenir de simple surveillance technologique ou d’opiacés. Au contraire, c’est une vision du monde qui fusionne les plaisirs des machines de Vegas avec la construction émotionnelle du monde de la sous-culture japonaise otaku — une tribu de consommateurs de niche connue pour sa dévotion à l’anime, au manga et aux jeux vidéo. Bien que longtemps subjugés dans les sous-sols de leurs parents, dans des coins étranges d’Internet et dans le quartier d’Akihabara à Tokyo, les otaku deviennent maintenant grand public.
Pour comprendre comment ce style unique de consommation façonne notre avenir, nous devons comprendre deux changements macro : l’un culturel, l’autre technologique. Le premier est la généralisation d’une logique otaku postmoderne qui privilégie la fiction sur les faits et les vibrations sur les mythologies partagées. Le second est le puissant mélange d’IA multimodales de nouvelle génération et leur capacité à créer des réalités alternatives personnalisées d’un simple clic. Ensemble, ils annoncent un avenir non pas d’un bien commun numérique partagé, mais de matrices hyper-personnalisées pour un.
Pour comprendre le premier changement, il faut déterrer le livre culte de la théorie des médias du théoricien japonais Hiroki Azuma, Otaku : les animaux de la base de données du Japon, publié en 2001. Chroniquant l’essor de la sous-culture otaku du Japon, Azuma a inventé le terme « animaux de la base de données » pour décrire un nouveau type de consommateur postmoderne émergeant des mondes de l’obsession pour le manga et l’anime. Ces consommateurs ne suivent plus de grands récits ou d’arcs narratifs cohérents. Au lieu de cela, ils se nourrissent d’une vaste base de données d’éléments esthétiques, de personnages et de tropes — sélectionnant les fragments qui leur procurent le plus d’impact. Ils sont des « animaux » non pas dans un sens péjoratif, mais en ce sens qu’ils privilégient le plaisir instinctif à la cohérence idéologique ou à un sens partagé.
Azuma explique l’essor de la sous-culture otaku dans le contexte de ce que le philosophe français Jean-François Lyotard a appelé le « déclin du grand récit ». De la fin du XVIIIe siècle au milieu du XXe siècle, les grands récits dominants étaient les pierres angulaires de la modernité, fournissant ordre et sens aux citoyens. Maintenant, dans un monde résolument postmoderne où les horizons traditionnels de sens se sont effondrés, les « grands récits » ont cédé la place à quelque chose de très différent.
Les grands récits, selon Azuma, fonctionnent comme un arbre. Le tronc est la grande « vision du monde » — un mythe partagé qui structure la culture. De ce tronc poussent les branches et les brindilles des « petits récits », les histoires quotidiennes, les rituels et les traditions qui renforcent et transmettent la vision du monde plus profonde. En essence, la « couche extérieure de surface » des petites histoires, des rituels et des actes de consommation relie les consommateurs à la « couche intérieure plus profonde » du grand récit. En Grande-Bretagne, des rituels comme aller à l’église, apprendre Shakespeare ou acheter une théière Wedgwood avec un mandat royal liaient les citoyens au mythe de Dieu, du Roi et du pays. De même, au Japon, réciter le Rescrit impérial sur l’éducation, visiter des sanctuaires, mener des cérémonies du thé liaient les citoyens à une vision vertueuse de l’Empereur, de la nation et du destin spirituel.
Azuma soutient que ces grands récits ont été perturbés par des vagues de bouleversements. D’abord est venue la westernisation de la Restauration Meiji, puis la Seconde Guerre mondiale. Dans leur sillage, citant Jean Baudrillard, Azuma décrit un monde postmoderne émergent où les modèles de réalité en tronc et en branches sont remplacés par une « hyper-réalité » rhizomatique. Dans ce monde, le sens devient un réseau enchevêtré où les lignes entre vérité et fiction se brouillent, et les symboles se détachent des réalités qu’ils représentaient autrefois. Ici, les grands récits sont « engloutis par le chaos d’une mer de simulacres », un monde où il n’y a « ni originaux ni copies ». Tout ce qui survit est un contenu fragmenté circulant sans fin sans histoire partagée — si seulement Baudrillard était en vie pour voir notre monde enivré par des mèmes, des tendances et des ambiances.
Cette hyperréalité post-moderne engendre un chaos idéologique. Alors que les grands récits s’effondraient — au Japon et dans le monde entier — leur absence se faisait sentir de diverses manières. Azuma soutient que les otaku ont été les premiers à ouvrir la voie à un nouveau mode de création de réalité dans un monde dépouillé de mythologies unificatrices. Abandonnant la « consommation narrative » conventionnelle, ils ont été les pionniers de ce qu’il appelle la « consommation de base de données » : une logique qui remplace la structure en arbre et en branches par une base de données et un état d’esprit de consommateur hyper-individualisé de choix et de mélange. Les histoires ne sont plus des parcours linéaires avec des arcs moraux, elles deviennent des fragments modulaires, extraits d’une base de données d’options et consommés comme des formes de plaisir et de construction d’identité hautement personnalisées.
Azuma observe que les otakus — contrairement aux fans ordinaires — sont presque entièrement désintéressés par le canon officiel ou la narration cohérente. Au contraire, ils sont obsédés par la chasse animaliste d’une montée émotionnelle — connue sous le nom de moe — déclenchée par des éléments modulaires de certains personnages de manga/anime. Différents otakus chassent différents « éléments moe- » (ou moe-yoso). Certains sont visuels : oreilles de chat, chaussettes montantes, coiffures spécifiques, tenues de servantes ou de marins, épées enflammées. D’autres sont plus abstraits : des schémas de discours distinctifs, des rythmes narratifs familiers, voire des courbes ou des angles de caméra particuliers.
Les otakus appellent la chasse à cette montée affective de sucre chara-moe. Beaucoup recherchent activement leurs éléments moe préférés, peu importe de quelle franchise ou série ils proviennent. De plus, les otakus utilisent des moteurs de recherche comme TINAMI pour filtrer les bases de données infinies et se régaler de leur moe de choix — qu’il s’agisse de styles de navires ou de lunettes, ou simplement de bons vieux bikinis.
Pour Azuma, ce qui distingue les otaku n’est pas leur dévotion aux mangas ou aux anime en soi, mais leur mode distinctif de consommation de bases de données. Bien que les objets de leur obsession — Pokémon, Yu-Gi-Oh!, Sylvanian Families — aient eu un débordement culturel évident vers l’Occident, c’est cette logique sous-jacente de consommation fragmentée et non narrative qui est véritablement devenue courante. L’univers cinématographique Marvel, apparemment sans fin et narrativement incohérent, ainsi que les guerres culturelles en ligne, démontrent le pouvoir hypnotique de la consommation de bases de données non linéaires sur les grands récits linéaires et cohérents. Notre paysage médiatique ressemble désormais à une base de données infinie de modèles d’images familiers, de phrases accrocheuses et de références décontextualisées — partagées et remaniées pour le simple frisson de la reconnaissance. Rire et partager un mème AI Ghibli qui fait mouche, c’est se livrer à chara-moe. En essence : si la consommation de bases de données est désormais le principal moteur de la demande, elle est maintenant soudainement confrontée à une offre parfaitement créée et organisée.
Ce qui nous amène à la macro-tendance qui alimente la Ghiblification : l’essor de l’IA multimodale de nouvelle génération. La mise à jour de ChatGPT-4o de la semaine dernière a offert un aperçu de ce qui se passe lorsque des utilisateurs ordinaires se voient remettre des outils pour conjurer des images dans n’importe quel style qu’ils souhaitent, instantanément. Bien que l’esthétique Ghibli ait pu voler la vedette, la portée de l’algorithme est bien plus large. De Lego à Pixar, South Park à The Simpsons, Internet a explosé avec un défilé surréaliste de transformations réalisées par des fans. Versions Ghibli de The Office. Versions Pixar de Severance. Les possibilités sont infinies. La Ghiblification ne concerne pas vraiment le Studio Ghibli, elle concerne l’accélération de l’hyperréalité avec l’IA.
Ce changement est entraîné par une nouvelle frontière dans l’IA générative : l’essor des modèles de langage large multimodaux, ou « omnimédia ». Il y a seulement quelques mois — les âges sombres, en termes d’IA — la plupart des modèles étaient cloisonnés par support. Pour écrire ou coder, vous utilisiez ChatGPT ou Perplexity. Pour créer une image, DALL·E ou Midjourney. Pour créer une vidéo, Runway ou Sora d’OpenAI étaient vos meilleures options. Pourtant, avec la dernière mise à jour de ChatGPT-4o (le « o » signifie omni), nous sommes entrés dans une nouvelle ère stratosphérique. Très bientôt, les modèles ne seront plus confinés à une seule entrée ou sortie. Au lieu de cela, ils sont en train d’être assemblés à travers les modalités — capables d’inhaler et d’exhaler du texte, des images, des vidéos, de l’audio, et plus encore. Dans ce nouveau paradigme « tout-à-tout », vous pouvez transformer une photo en dessin animé, un jeu, une chanson — même une statue imprimée en 3D. Avec juste une seule invite sans friction, chacun de nous devient le bâtisseur de son propre univers privé.
Ça ne va faire que s’accélérer. La principale barrière à la Ghiblification entièrement automatisée n’est plus le génie des développeurs d’IA ou la créativité humaine, mais la puissance de calcul. Aujourd’hui, il faut 30 secondes pour générer une image détaillée presque parfaite. Bientôt, ce sera instantané. Rien qu’en 2024, les entreprises technologiques ont investi plus de 100 milliards de dollars dans l’infrastructure de traitement de l’IA pour accélérer les choses. D’ici 2028, ce chiffre est prévu pour dépasser les 200 milliards de dollars. La direction est claire : la seule chose qui sépare les utilisateurs des mondes immersifs et personnalisés de l’IA — qu’ils soient Ghibli, Pixar, ou South Park — est le temps de traitement. Les droits de propriété intellectuelle et les coûts énergétiques peuvent être des obstacles, mais en matière d’IA, il semble que les politiciens soient plus préoccupés par les essaims de drones IA chinois que par les droits des artistes et les émissions. Tout le reste — la demande, la technologie, les serveurs — est là.
De plus, cela est amplifié par un autre type d’IA : des algorithmes de recommandation basés sur les graphes d’intérêt. Au cours des dernières années, la curation des flux a discrètement évolué du graphe social (ce que vous et vos amis aimez et suivez) au graphe d’intérêt (ce à quoi vous prêtez réellement attention). Les algorithmes de la page « Pour vous » de TikTok ne se soucient pas de ce que vous prétendez valoriser ; ils s’optimisent pour ce sur quoi vous restez. Et que veulent les gens ? De la bouillie d’IA. Comme l’a dit Altman : « la bouillie d’un homme est le trésor d’un autre ». Les dernières recherches le confirment. Une étude aveugle récente a révélé que la plupart des gens préfèrent sincèrement les pastiches d’IA des grands poètes à la vraie chose. Sur un plan critique, il est facile de dire que l’on croit à la caractérisation de la créativité de l’IA par Miyazaki et Nick Cave comme « une grotesque moquerie ». En pratique, c’est plus difficile. Alors que les anciens modèles produisaient des pastiches inquiétants et créativement en faillite, les modèles visuels émergents deviennent de plus en plus indiscernables pour l’œil non entraîné. La ghiblification est peu susceptible d’être une tendance éphémère.
Et nous voici donc au début de la nouvelle ère des Otaku, peut-être à la fin de la réalité partagée telle que nous la connaissons. En réfléchissant au processus créatif, Miyazaki a un jour expliqué que « la création d’un monde unique provient d’un énorme nombre de fragments et de chaos ». Maintenant, dans un cruel retournement de situation, l’opposé se produit. La réalité est en train d’être brisée en milliards de mondes otaku façonnés par l’IA pour un seul, mais peut-être que c’est exactement ce que nous voulons.
Join the discussion
Join like minded readers that support our journalism by becoming a paid subscriber
To join the discussion in the comments, become a paid subscriber.
Join like minded readers that support our journalism, read unlimited articles and enjoy other subscriber-only benefits.
Subscribe