Falcon-180B : le nouveau roi des modèles LLM ?

Falcon 180B est un modèle de langage open-source qui fait beaucoup parler de lui ces derniers temps. Situé entre GPT-3.5 et GPT-4 en termes de capacités, il offre une nouvelle voie à explorer pour les développeurs et les passionnés de technologie. Est-il à la hauteur de l’engouement qu’il suscite ? Comment se comporte-t-il face à des géants comme GPT-4 ? Plongeons dans le vif du sujet pour le découvrir.

Falcon 180B : qu’est-ce qui le rend si spécial ?

Falcon 180B est actuellement en tête du peloton dans le monde des modèles linguistiques open-source. Selon le classement Hugging Face Open LLM, il est classé premier parmi les modèles open-source sur la base de divers critères. Ce qui le distingue, c’est son entraînement sur un nombre stupéfiant de 180 milliards de paramètres, ce qui en fait le nouveau roi dans le domaine des logiciels libres. À titre de comparaison, le plus grand modèle LLM jusque-là en comptait 70 milliards.

@passion_digitale_ai
Plus puissant que ChatGPT et entièrement gratuit : découvre le Falcon 180B ! 🤯🚀 #ia #outilsia #aitools #chatgpt #falconb
♬ Blade Runner 2049 – Synthwave Goose

Licence et utilisation de Falcon 180B

La licence de Falcon n’est pas simple. Bien qu’il s’agisse d’un modèle open source, il n’est pas entièrement libre de droits pour toutes les utilisations. La licence restreint particulièrement son utilisation commerciale (en tant que service par exemple via son API). Il semblerait qu’un usage à titre personnel puisse se faire sans problème. A noter qu’il faut évidemment une machine de guerre pour espérer faire tourner un modèle aussi puissant localement.

Une utilisation occasionnelle, sur des prompts assez simples semble faisable via l’interface Spaces d’HuggingFace.

Comparaison des performances : Falcon 180B vs. GPT

Pour analyser ses performances face aux géants du domaine, j’ai réalisé deux types de tests : une requête de contenu classique et une requête sur du contenu engageant (notamment sur les réseaux sociaux).

Il m’était impossible de le tester à plus grande échelle, car son utilisation via l’interface HuggingFace est assez limitée.

Test n°1 : Contenu classique

Sur une requête classique, on se retrouve avec un contenu similaire à du GPT 3.5, et un peu moins qualitatif que du GPT4.

Voici les résultats obtenus sur un même prompt : Tu es un expert IA. Tu t’adresses à une audience néophyte. Explique en quoi l’intelligence artificielle peut avoir un impact sur de nombreux métiers d’ici quelques années. Ne dépasse pas 250 mots.

Résultats GPT 3.5 :

L’intelligence artificielle (IA) révolutionne déjà de nombreux métiers et continuera de le faire dans les prochaines années. Cette technologie permet aux ordinateurs d’apprendre à partir de données, de comprendre des informations complexes et d’effectuer des tâches autrefois réservées aux humains.

Dans le domaine de la santé, l’IA aide les médecins à diagnostiquer les maladies plus rapidement et précisément. Dans l’industrie, elle optimise la production en prédisant les pannes de machines. Le secteur financier l’utilise pour prévoir les tendances du marché et détecter la fraude. Dans le domaine de l’éducation, l’IA personnalise l’apprentissage des élèves.

L’impact de l’IA est également visible dans le commerce en ligne, où elle recommande des produits aux consommateurs, et dans les transports, avec le développement des véhicules autonomes. Même la création artistique bénéficie de l’IA, qui génère de la musique, des œuvres d’art et des scénarios.

Cependant, l’IA soulève des questions éthiques et de confidentialité. Il est essentiel de surveiller son développement pour garantir qu’il profite à la société tout entière. Les professionnels de tous les secteurs devront se former pour tirer parti de cette révolution technologique et s’adapter à un monde où l’IA jouera un rôle de plus en plus important.

Résultats Falcon-180B :

L’intelligence artificielle est un domaine fascinant qui a déjà commencé à changer notre vie quotidienne. En tant qu’expert IA, je peux affirmer que cette technologie aura un impact majeur sur de nombreux métiers dans les années à venir.

Prenons par exemple le secteur médical. Grâce à l’IA, il sera possible d’analyser des milliers de données patient pour établir des diagnostics plus rapides et plus précis. Cela permettra aux médecins de se concentrer sur leur cœur de métier : soigner les patients. De même, dans le domaine juridique, l’IA pourra être utilisée pour analyser des contrats ou des précédents judiciaires afin de fournir des recommandations stratégiques aux avocats.

Dans le secteur manufacturier, l’IA permettra la création d’usines intelligentes où les machines communiqueront entre elles pour optimiser la production tout en réduisant les coûts. Dans le commerce, les chatbots alimentés par l’IA offriront une expérience client personnalisée et immédiate, disponible 24h/24. Et ces exemples ne sont que la pointe de l’iceberg.

J’aime le fait que Falcon soit plus précis dans la justification des bénéfices apportés par l’IA par rapport à mon prompt. Je trouve qu’il respecte davantage le cadre dans lequel la requête lui est posée.

En revanche, il a la fâcheuse tendance de réaffirmer des éléments du prompt dans son contenu (« en tant qu’expert IA »). Rien qu’un prompt un peu travaillé ne puisse gommer mais il est important de le noter.

En réalisant plusieurs tests, j’ai également moins l’impression de voir les patterns typiques que l’on peut retrouver sur ChatGPT. Sûrement une question d’habitude, mais ca fait du bien d’avoir plus de variations grammaticales.

Test n°2 : Contenu engageant

Voici les résultats obtenus sur un même prompt : Tu es un média spécialisé IA. Tu t’adresses à une audience passionnée. Ecris moi un tweet engageant incitant l’internaute à s’abonner à ma newsletter pour suivre les dernières actualités sur l’intelligence artificielle.

Résultats GPT 3.5 :

🚀 Passionné(e) d’IA et de tech ? Ne manquez plus aucune info brûlante ! 🔥 Abonnez-vous à ma newsletter pour être au top des dernières avancées en intelligence artificielle. 🤖 Restez connecté(e) avec le futur ! 👉 [Lien de la newsletter] #IA #Tech #AbonnezVous #IAEnAvant

Résultats Falcon-18B :

Restez informés des avancées en #IntelligenceArtificielle et recevez notre newsletter hebdomadaire Ne manquez pas les dernières news de l’IA en vous abonnant dès maintenant 🚀📩 #IA #newsletter #abonnement

Si Falcon-180B est moins créatif dans la forme, je trouve que ce qu’il propose est plus pertinent par rapport à la requête établie. Cet exemple n’est pas forcément le plus parlant, mais il va droit au but, sans forcément rappeler le contexte. Il a une utilisation moins farfelue des emojis et autres icônes.

Sur la globalité des tests réalisés, je l’ai trouvé beaucoup plus performant sur cet aspect. C’est aussi un avis subjectif sur la forme. Je vous invite à tester par vous-mêmes.

Les limites de Falcon 180B

Il semblerait que Falcon 180B soit moins politiquement correct. Contrairement à d’autres modèles, Falcon est plus ouvert et moins censuré. Cela peut être à la fois un avantage et une limite, en fonction de votre cas d’utilisation. Si vous souhaitez écrire sur des sujets sensibles, il est possible que Falcon soit plus enclin à vous fournir des réponses intéressantes que le modèle d’OpenAI.

Toutefois, mes tests sur le sujet n’étaient pas vraiment consistants. Le modèle imposait parfois une limite, quand d’autres fois il acceptait la requête.

Conclusion

Le Falcon 180B marque une étape importante dans le domaine des modèles linguistiques libres. Non seulement il se distingue par ses performances, mais il offre également aux développeurs une nouvelle voie à suivre.

Sur mes tests à petite échelle, j’ai trouvé ce modèle vraiment pertinent dans certaine situation. Je ne peux que vous inviter à tester par vous-même. Vous trouverez ci-dessous les liens vers le modèle. Et si vous avez une bête capable de faire tourner ce modèle pour effectuer des tests à plus grande échelle, n’hésitez pas à partager vos retours en commentaires !

Sources :

https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

https://huggingface.co/blog/falcon-180b#hardware-requirements

https://huggingface.co/spaces/tiiuae/falcon-180b-license/blob/main/LICENSE.txt