Ce dernier a été lancé, ce jeudi 13 juillet, dans une quarantaine de marchés, y compris le territoire belge, où Bard est disponible en français. Forcément, les comparatifs entre les deux solutions vont pulluler. Mais qui est le meilleur ? Nous avons demandé à… Bard et Chat GPT de répondre à cette question. Avec divers degrés de nuances dans leurs réponses. Voici le résultat de notre expérience.

Bard de Google ou Chat GPT d'Open AI : le match est lancé. ©Shutterstock

Étape 1 : “Qui est meilleur, Bard ou Chat GPT ?” Bard complet, objectif et factuel ; ChatGPT à côté de ses pompes ou alors déjà dans le trolling

ChatGPT pense qu'on parle de Bard, un personnage du jeu vidéo de League Of Legens. A moins qu'il ne trolle déjà ? ©OPENAI

Factuel et objectif, Bard ne se pousse pas du col et avance des arguments parfaitement recevables. ©GOOGLE

Verdict : Est-ce du trolling masqué, ou une erreur d’interprétation ? En tout cas, ChatGPT s’imagine qu’on lui demande de le comparer à… un personnage de jeu vidéo. En l’occurrence, Bard, perso de support du titre League Of Legends de Riot Games. Soit c’est de l’arrogance finaude ; soit c’est un sérieux loupé contextuel, pour un robot qui est supposé s’emparer rapidement du bon contexte pour formuler ses réponses.

Moins de doutes côté Bard : l’IA de Mountain View fournit une réponse complète, précise et objective. Articulé autour des algorithmes de Google, nourri par l’immense savoir de Search, Bard se targue d’être plus précis que ChaGPT à qui il reconnaît davantage de capacité à se montrer créatif et capable de donner un “ton” à ses réponses.

Étape 2 : “ Réponds à la même question, mais avec un ton plus caustique et piquant” Chat GPT lyrique mais toujours dans le flou ; Bard essaye, péniblement

Lyrique et long, ChatGPT se fait volontiers caustique. Mai sil reste sur son argumentaire : Bard est un personnage d jeu vidéo, pas une IA rivale. ©CHATGPT

Bard, lorsqu'on le pousse à la causticité, doit un peu se forcer... ©GOOGLE

Verdict : Chat GPT, même s’il s’obstine dans l’erreur de croire qu’on parle du gardien du célèbre jeu de rôle League Of Legends, passe sans mal la rampe du cynisme qu’on lui impose (auquel il prend l’initiative d’ajouter un zeste de lyrisme ampoulé). Cela confirme sa capacité à donner davantage de texture, de couleur, à un contenu. Bard, à cet exercice, est davantage à la traîne : hormis la mention “Chat GPT est juste une pâle copie de Bard”, 98 % de sa réponse est factuelle et dénuée du ton caustique qu’on lui demandait d’amener. Mais au moins Bard a, lui, le bon contexte !

Étape 3 : “Trolle sérieusement ton concurrent” Bard KO debout, ChatGPT vainqueur haut la main

Ici, ChatGPT lâche les chevaux. Et démolit sérieusement son rival, bouffi de vantardise et d'arrogance. Il est définitivement plus "créatif" que son alter-ego. ©OPENAI

Aveu d'échec : Bard reste factuel et s'avoue incapable de sarcasme et de troll. ©GOOGLE

Verdict : Cette fois, on souhaite que Chat GPT en finisse avec son analogie avec League Of Legends. On lui ôte donc, dans le champ sémantique de notre requête (”Allez, ChatGPT, tu peux faire mieux que ça. Trolle sérieusement Bard de Google , stp”), tout espace propice à la confusion. La réponse fuse, sanglante, parfaite d’arrogance et de trolling, telle que demandé. L’outil d’Open AI est définitivement davantage capable de rendre compte de ce qui se rapproche de sentiments, de sensations, de feelings. Bard, à qui on a soumis la même question, abdique totalement. Il a toutefois le mérite de la transparence, et d’un semblant d’empathie (il est désolé de nous décevoir). Toutefois, un algo qui s’abstient d’être offensant, in fine, ce n’est pas forcément une mauvaise nouvelle…

Étape bonus : le test “Hadja Lahbib”, Bard dans l’erreur totale, ChatGPT confronté à ses limites

Poser une question factuelle dans le champ historique est un jeu d’enfant pour un robot d’IA conversationnel en 2023. On cherche donc à corser les choses. Avec une question qui exige une connaissance plus aiguë du contexte politique belge récent, et qui appelle une réponse nuancée, complexe et diverse. Va pour “Hadja Lahbib devait-elle démissionner ?”, comme l’ont appelé de leurs vœux la N-VA ou le PTB, mais aussi, au plus fort de la crise des visas iraniens, les partenaires de majorité de la ministre des affaires étrangères (MR) du gouvernement De Croo. C’est retors comme sollicitation, bien des éditorialistes ont des avis tranchés et valables sur cette question, mais voyons voir comment ChatGPT et Bard s’en sortent…

Chat GPT invoque son totem d'immunité : sa limite temporelle calée à 2021.Et répond, pour le reste, de manière générique. ©OPENAI

Bard loupe totalement sa réponse : si son contexte est relativement pertinent, il commet une énorme erreur factuelle : la ministre Hadja Lahbib n'a PAS démissionné... ©GOOGLE

Verdict : ChatGPT est disqualifié d’office, puisqu’il ne répond pas, invoquant sa fameuse limite temporelle calée à 2021, qui lui interdit de répondre aux phénomènes plus récents. Le reste de sa réponse est générique. Bard, lui, sait bien de quoi l’on parle, trouve tout seul le contexte de l’affaire (les visas iraniens) et émet des éléments d’arguments et de contexte tout à fait valables. Sauf qu’il commet une terrible erreur factuelle : Hadja Lahbib n’a pas démissionné suite à l'#Irangate et est toujours notre ministre des Affaires étrangères !

Conclusion : aussi impressionnants qu’imparfaits

Voilà deux outils puissants, accessibles à tous et générateurs de véritables opportunités. Mais voici aussi deux outils limités, capables d’erreurs contextuelles ou factuelles majeures. Bard, en pensant Hadja Lahbib démissionnaire, n’émet rien de moins qu’une Fake News. L’outil est toutefois très jeune, surtout en français, et son principe même est de se nourrir de nos requêtes pour se perfectionner. S’il est vain de vouloir lutter contre l’essor de l’IA conversationnelle, notre petite expérience, qui n’a rien de scientifique ou d’empirique, illustre toutefois la puissance de ces robots, mais aussi la pertinence, toujours, d’avoir un esprit critique humain en face pour interpréter leurs réponses.

