All
News
Articles

Teuken-7B: Europas multilinguales KI-Modell geht Open Source! 🌍

Benedikt Brauner

9.12.2024

Zusammenfassung

Mit Teuken-7B hat das europäische Forschungsprojekt OpenGPT-X ein leistungsstarkes, multilingual trainiertes KI-Modell veröffentlicht. Es deckt alle 24 Amtssprachen der EU ab, steht kostenlos auf Hugging Face zur Verfügung und kann sowohl für wissenschaftliche als auch kommerzielle Zwecke genutzt werden. Teuken-7B ist ein großer Schritt in Richtung mehr Unabhängigkeit und Innovation im europäischen KI-Sektor.

Das Forschungsprojekt OpenGPT-X hat mit Teuken-7B ein KI-Sprachmodell entwickelt, das die 24 Amtssprachen der Europäischen Union unterstützt. Das Modell steht ab sofort auf der Plattform Hugging Face kostenlos zum Download bereit und kann sowohl für wissenschaftliche als auch kommerzielle Zwecke genutzt werden.

Warum ist das interessant?

Teuken-7B wurde von einem Konsortium europäischer Partner – darunter das Fraunhofer IAIS und IIS – entwickelt. Es bietet eine transparente und leistungsstarke Alternative zu bestehenden KI-Modellen. Besonders spannend: 50 % der Pretraining-Daten stammen aus nicht-englischen Quellen. Das macht Teuken-7B ideal für mehrsprachige Anwendungen in Europa und weltweit.

Ein weiterer Pluspunkt: Unternehmen können sensible Daten lokal verarbeiten, ohne diese an externe Anbieter weitergeben zu müssen – ein großer Vorteil, besonders in Bereichen mit hohen Datenschutzanforderungen.

Das Modell umfasst sieben Milliarden Parameter und wurde mithilfe des Supercomputers JUWELS am Forschungszentrum Jülich trainiert. Besonders innovativ ist ein neuer Tokenizer, der die Verarbeitung von Sprachen mit komplexen Wortstrukturen effizienter macht.

Anwendungen und Möglichkeiten

Teuken-7B bietet zahlreiche Einsatzmöglichkeiten:

  • Chatbots: Für mehrsprachige Kundenbetreuung in internationalen Märkten.
  • Textgenerierung: Erstellung hochwertiger Inhalte in europäischen Sprachen.
  • Wissensmanagement: Automatische Analyse und Zusammenfassung großer Textmengen.

Das Modell steht in einer Forschungs- und einer kommerziellen Version unter der Apache-2.0-Lizenz bereit, wodurch es sich leicht an spezifische Anforderungen anpassen lässt.

Fazit: Ein Schritt nach vorne für Europa

Neben Mistral, dem KI-Modell aus Frankreich, das in diesem Jahr für Schlagzeilen gesorgt hat (Mehr dazu in unserem Artikel), markiert Teuken-7B einen weiteren Fortschritt in Europas KI-Entwicklung. Mit Unterstützung des Bundesministeriums für Wirtschaft und Klimaschutz (BMWK) zeigt dieses Projekt, wie öffentliche Fördergelder zur Entwicklung innovativer Basistechnologien beitragen können.

Teuken-7B ist ein wichtiger Schritt, um Europa im Bereich der Künstlichen Intelligenz wettbewerbsfähiger und unabhängiger zu machen – und gleichzeitig eine Einladung an Unternehmen und Forschende, die Zukunft der KI aktiv mitzugestalten.

Anrufe neu gedacht, mit fonio.

Lass uns dir in einem kostenlosen Erstgespräch zeigen, warum wir das führende Tool für KI-Telefonassistenten auf Deutsch anbieten.