Après l'échec cuisant des metaverses et l'adoption à demi-teinte de son intelligence artificielle maison Llama, Meta compte toujours peser au niveau des IA avec l'introduction de son nouveau modèle génératif Muse Spark. Terminé l'open source qui a surtout profité aux autres, place à un moteur fermé. La nouvelle IA est une création du Meta Superintelligence sous la direction d'Alexander Wang. En neuf mois, Meta dit avoir fait table rase et reconstruit à partir de zéro son infrastructure, son architecture de modèles et ses jeux de données pour aboutir à Muse Spark.
Le modèle a pour ambition d'être multimodal, à savoir, accepter indifféremment en entrée, le texte, la voix ou les images. Il est d'ailleurs censé faire mieux que les autres en matière d'entrées visuelles. Par exemple, si on lui « montre » une image d'un objet et qu'on lui demande des conseils pour l'utiliser, il peut générer un mode d'emploi. Il sait également transformer une photo en un jeu.
S'il n'est pas open source, Muse Spark est néanmoins entièrement gratuit et totalement exploitable sans abonnement contrairement à ses concurrents. Mais, comme on le sait, quand c'est gratuit, c'est l'utilisateur le client. C'est d'ailleurs le fonds de commerce de Meta avec l'ensemble de ses services (Facebook, Instagram...).
Des requêtes par l’image
Et d'ailleurs, l'outil est bien entendu conçu pour être intégré en tant que cerveau unique de Meta AI dans Facebook, Instagram, WhatsApp et d'éventuels futurs produits de la firme.
Mais qu'est-ce qui différencie vraiment Muse Spark d'un ChatGPT ou Gemini ? L'IA se distingue par un mode de raisonnement approfondi baptisé « Contemplating mode ». Plutôt que de gérer une seule chaîne de réflexion, le modèle orchestre plusieurs sous‑agents qui travaillent en parallèle avant de fusionner leurs conclusions.
Lire l'article
Nouvelle façon de penser et nouvelle façon d'être entraîné pour moins consommer également. Ainsi, selon Meta, il nécessiterait 10 fois moins de puissance de calcul à l'entraînement que l'ancien modèle haut de gamme Llama 4 Maverick. Il y parvient essentiellement grâce à une méthode de « dressage » par contrainte. Si l'IA réfléchit trop longtemps pendant l'apprentissage par renforcement, elle est pénalisée. Cela l'oblige à résoudre les problèmes de façon efficace avec moins de tokens.
Avec sa façon de « penser » particulière, il y a peut-être un peu de Yann LeCun dans l’IA de Muse Spark, même si le parrain de l’IA qui a quitté Meta n’est plus un fan des LLM depuis de nombreuses années. © Meta
Frugal, mais puissant
Au final, selon les premiers comparatifs, Muse Spark se placerait juste derrière les modèles phares de Google, OpenAI et Anthropic, tout en consommant nettement moins de tokens de sortie que ses rivaux.
Lire l'article
Muse Spark a également des spécialités pour lesquelles il s'en tire mieux. Ainsi, Meta met en avant ses performances sur les questions relatives à la santé. Le modèle peut, par exemple, analyser un texte long, des résultats d'examens imagés, puis générer un plan d'explications ou de questions à poser à un professionnel de santé, sans se substituer à un diagnostic. De même, dans le domaine scientifique, il affiche aussi de bons scores sur des tests de compréhension de figures et de graphiques.
Pour le moment, Muse Spark ne fonctionne que de façon textuelle. Meta annonce son intégration prochaine dans ses services et objets connectés, comme ses lunettes.
Le fait qu'il soit propriétaire est également un argument qui montre que l'IA est pensée pour accélérer la monétisation de l'écosystème Meta et notamment de ses produits connectés. Reste à savoir si cette stratégie va faire changer d'avis les utilisateurs déçus de Llama. L'autre difficulté va être de les inciter à partager leurs photos personnelles et leurs secrets médicaux avec une entreprise qui n'a jamais été réputée pour respecter le traitement des données privées.
.png)
5 days ago
English (United States) ·
French (France) ·