Mise à jour 04/09/2023 : Code interpreter devient officiellement Advanced Data Analysis. Il est accessible au moment du choix du modèle GPT-4, de la même façon que pour les plugins.
Intégrée à ChatGPT le 6 juillet dernier, l’application Code interpreter marque le début d’une nouvelle ère pour l’IA. Une ère qui n’en est qu’à ses balbutiements et qui risquent de se développer à vitesse grand V dans les prochains mois.
Qu’est-ce qui se cache derrière ce nom pas très parlant ? Et en quoi cela est-il une révolution ?
En quelques mots, nous passons de la simple réception d’informations à la mise en application. OpenAI a intégré un mini-ordinateur dans GPT-4 avec Code interpreter, ouvrant ainsi un tout nouveau monde de possibilités. Désormais, ChatGPT peut accomplir des tâches pour vous.
Et ce n’est que le début, la plupart des possibilités restent encore à explorer. L’arrivée de Code interpreter marque une avancée significative en passant d’un simple moteur de réponse venant concurrencer les moteurs de recherche comme Google, à une concurrence directe avec Auto GPT.
C’est-à-dire un système autonome capable d’enchaîner les actions de lui-même sans que l’utilisateur n’ait besoin d’intervenir. Appétissant n’est-ce pas ? Etudions le sujet un peu plus en détails pour identifier les mises en application qui peuvent en sortir.
Comment activer Code interpreter ?
Avant toute chose, accédez aux paramètres, il est impératif d’être abonné à ChatGPT Plus. Si jusqu’ici les 20$/mois nécessaires à la souscription n’étaient pas chers payés, avec Code Interpreter, c’est vraiment cadeau !
Une fois inscrit, rendez-vous dans votre profil puis dans Settings & Beta. Cliquez sur Beta features, et cochez Code interpreter :
En sélectionnant le modèle GPT-4 en haut, vous verrez désormais apparaitre Code interpreter. Une fois dessus, vous ferez apparaitre un tout nouveau bouton dans le champ de conversation. Il est désormais possible d‘uploader des fichiers, permettant ainsi d’exécuter des actions sur divers types de médias. Vous pouvez uploader des PDF, des JPEG, des fichiers Excel et même des fichiers vidéo basiques :
De la réception d’informations à l’action
Pour illustrer notre propos, prenons l’exemple d’une image générée par Midjourney :
Nous allons transformer cette image d’un trou noir en vidéo en effectuant un dézoom progressif. GPT-4 est désormais capable de traiter des images et des vidéos. Nous devons spécifier la durée souhaitée pour la vidéo, par exemple dix secondes, en se concentrant sur le centre de l’image :
Voici le résultat :
Comment fonctionne Code interpreter ?
À tout moment, vous avez la possibilité d’afficher le travail réalisé. Vous pourrez ainsi voir que Code interpreter est intégré à GPT-4 sous forme d’un mini-ordinateur avec des spécifications limitées, mais fonctionnel. Cela lui permet d’exécuter le code directement dans l’interface, plutôt que de simplement le générer et de devoir le faire fonctionner sur un ordinateur séparé. Dans cet exemple, le code est généré en arrière-plan pour manipuler l’image et créer une vidéo à partir de cette même image. Toutes les étapes, de l’ouverture de l’image à la création de la vidéo, sont gérées automatiquement.
Autre point très intéressant, c’est que souvent, Code interpreter va d’abord expliquer sa manière de fonctionner. Prenons l’exemple d’un fichier Excel tout simple.
J’envoie un fichier de 2 colonnes. La 1ère contient le prénom d’une personne, la seconde ses informations de contact sur une ligne (téléphone + mail). Afin d’organiser la donnée correctement, je souhaiterais que les informations de téléphone et mail soient séparée en plusieurs colonnes :
Je fournis mon fichier, ainsi que ma demande à Code interpreter :
En quelques secondes, Code interpreter a réalisé le travail demandé, et nous permet de télécharger le fichier modifié :
Voici le résultat obtenu :
Evidemment, cet exemple est très simple, et aurait pu être réalisé sans l’aide de cet outil. Malgré tout, Code interpreter fait preuve d’une compréhension assez incroyable lorsqu’il s’agit d’analyser les données d’un fichier. Et il est particulièrement satisfaisant de le voir se creuser la tête pour nous lorsqu’on lui demande une tâche plus complexe :
Analyse de données et applications potentielles
Dans la même veine, grâce à Code interpreter, GPT-4 peut être utilisé pour analyser des données, offrant ainsi une approche plus facile d’accès pour interagir avec de grands ensembles de données. Il peut générer des graphiques à partir de données de diverses sources, telles que les relevés bancaires, les feuilles de calcul d’entreprise, et même les données de marché. Cette fonctionnalité permet de poser des questions sur les données et d’obtenir des réponses exploitables.
Expérimenter pour des résultats plus adaptés
L’interface de Code interpreter reste basé sur le Chatbot initial. Il agit donc comme un agent conversationnel avec qui vous pouvez échanger.
Si le résultat renvoyé ne répond pas à vos attentes, vous avez la possibilité de lui dire ce qui ne va pas, et il se corrigera tout seul. Vous pouvez alors expérimenter différents prompts et paramètres pour obtenir le résultat optimal.
Si l’on reprend le cas de l’image transformée en vidéo, je peux tout à fait lui indiquer de changer la cible et le temps sans avoir à réinitialiser un nouveau chat.
À lire également : Comment obtenir de meilleurs résultats sur ChatGPT grâce aux instructions personnalisées ?
Combiner analyse d’image et Code interpreter
La combinaison des capacités d’analyse d’image et de Code interpreter ouvre la voie à des possibilités infinies. Par exemple, il est possible de lire des numéros à partir d’une image, afin d’en extraire des informations de reçus ou de factures. Certaines tâches plus complexes peuvent nécessiter des ajustements ou une révision des requêtes pour obtenir les résultats souhaités. Comme lorsqu’on travaille avec un humain finalement.
Code interpreter dans ChatGPT marque une avancée significative dans le développement et l’exploitation de l’IA. En apprenant à conserver efficacement avec lui, vous vous ouvrez à des possibilités de mise en application infinies. Il permet de passer de la simple réception d’informations à la mise en action et à l’analyse de données. Cette fonctionnalité offre un potentiel énorme pour une variété d’applications, allant de la génération de contenu multimédia à l’analyse de données professionnelles.
J’aurai l’occasion de vous partager d’autres idées concrètes sur son utilisation dans de futurs articles.
En attendant, si j’ai un conseil à vous donner, expérimentez et conversez avec Code interpreter, cela vous donnera assurément des tonnes d’idées d’application. Et puis, quand vous ne savez pas, demandez à Code interpreter !