Futuristisches Schweizer Labor mit Bergen und KI-Technologie

Apertus: Schweizer KI-Projekt setzt neuen Standard für offene Sprachmodelle

Die Swiss AI Initiative hat mit Apertus ein KI-Sprachmodell vorgestellt, das durch vollständige Offenheit und Datenschutzbestimmungen neue Maßstäbe für europäische und insbesondere Schweizer Anforderungen setzen soll. Entwickelt von den führenden Forschungsinstituten der Schweiz, hebt sich Apertus mit Transparenz und Mehrsprachigkeit von anderen Systemen ab.

Wichtigste Erkenntnisse

  • Apertus ist ein komplett offenes Sprachmodell, entwickelt von Schweizer Forschungsinstitutionen.
  • Volle Transparenz durch Offenlegung aller Entwicklungsartefakte inklusive Trainingsdaten, Code und Checkpoints.
  • Stark auf Datenschutz, Ethik und Einhaltung europäischer Vorschriften ausgerichtet.
  • Schwerpunkte: Mehrsprachigkeit, inklusive Schweizer Landessprachen und Fokus auf gesellschaftliche Werte.

Entwicklung und Besonderheiten von Apertus

Apertus entstand in Kooperation von ETH Zürich, EPFL und dem Nationalen Supercomputing Centre der Schweiz (CSCS). Ziel war es, eine sichere und nachvollziehbare Alternative zu den teils undurchsichtigen KI-Modellen großer Tech-Konzerne zu bieten.

Ein zentrales Merkmal ist die Offenlage des gesamten Entwicklungszyklus. Anders als viele „Open-Weight“-Modelle liefert Apertus sämtliche Datenaufbereitungsskripte, Trainingscode, Evaluationswerkzeuge und Zwischen-Checkpoints gleich mit. Dadurch können Forscher, Unternehmen oder auch die Zivilgesellschaft die Entwicklung genau nachvollziehen und darauf aufbauen.

Datenschutz und Compliance als Leitmotiv

Das Modell wurde ausschließlich mit öffentlich einsehbaren Daten trainiert. Besonderes Augenmerk lag dabei auf der Einhaltung von Urheberrecht und Datenschutz: Sowohl aktuelle als auch rückwirkende Opt-Out-Präferenzen von Websites wurden respektiert. Zudem sorgt ein spezieller Filterprozess dafür, dass schützenswerte oder toxische Inhalte konsequent ausgeschlossen werden.

Mehrsprachigkeit als Stärke

Apertus wurde mit einem extrem vielfältigen, mehrsprachigen Datensatz trainiert: Über 1800 Sprachen sind abgedeckt, 40 Prozent der Trainingsdaten stammen aus nicht-englischen Quellen. Besonders bemerkenswert ist die Einbindung der Schweizer Landessprachen, einschließlich Rätoromanisch und Schweizerdeutsch. In internen Benchmarks übertrifft Apertus in der Übersetzung zwischen Deutsch und verschiedenen Rätoromanisch-Varianten bestehende offene Modelle.

Werteorientierung und technische Umsetzung

Das Alignment des Modells orientiert sich an den Schweizer Verfassungswerten Neutralität und Konsens. Bei der Bewertung kontroverser Inhalte diente ein spezialisiertes Verfahren auf Basis der sogenannten Swiss AI Charter als Grundlage. Die Trainingsphase erfolgte auf einem der leistungsfähigsten europäischen Supercomputer mit bis zu 4096 Nvidia-GPUs und rund 15 Billionen Tokens.

Potenzial für Forschung und Wirtschaft

Fachverbände und Branchenvertreter sehen im Apertus-Modell eine große Chance, die spezifischen rechtlichen und ethischen Anforderungen der Schweiz und Europas zu erfüllen. Besonders der Finanz- und Industriesektor begrüßen die erhöhte Kontrolle sowie die Übereinstimmung mit Datenschutz- und Bankgeheimnisstandards. Allerdings wird betont, dass auch internationale Lösungen für gewisse Anwendungsfälle notwendig sein könnten.

Verfügbarkeit und Ausblick

Apertus ist als Open-Source-Projekt über Hugging Face und PublicAI öffentlich nutzbar. Experten werten den Launch als bedeutenden Schritt in Richtung transparenter, kontrollierbarer KI-Lösungen für Wirtschaft, Wissenschaft und Gesellschaft.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

You May Also Like