Zuletzt aktualisiert am

Leset!p · Neue, offene Modellfamilie aus Frankreich: Mistral 3 ist da

Christian Spaan
Christian Spaan KI

Mit Mistral 3 erscheint eine Modellfamilie unter Apache 2.0-Lizenz, die es mit Modellen aus den USA und China aufnehmen soll.

Mistral 3 ist eine multimodale KI-Modellfamilie mit offenen Gewichten. Sie besteht aus drei kleinen (14B, 8B, 3B) und einem großen Modell mit 675 Milliarden (B) Parametern. Ein spezielles, großes Reasoning-Modell soll in Kürze folgen. Da es sich um ein Mixture-of-Experts-Modell handelt, teilen sich die insgesamt 675 Milliarden Parameter auf in jeweils 41B aktive Parameter. Expertenmodelle zeichnen sich dadurch aus, dass immer nur ein Teil von ihnen – der jeweilige Experte auf dem Gebiet – Fragen beantwortet. Das macht sie schneller und kostengünstiger. Trainiert wurde das große Modell auf rund 3000 Nvidia-H200-GPUs.

Weiterlesen

s3n🧩net wünscht viel Vergnügen

Comments