OpenAI stellt Modell o1 vor, um KI-Denkfähigkeiten zu verbessern

Gábor Bíró 13. September 2024
3 Min. Lesezeit

OpenAIs neuestes Modell für künstliche Intelligenz, o1 (interner Codename „Strawberry“), ist jetzt verfügbar. Das Modell o1 wurde speziell entwickelt, um die Denkfähigkeiten künstlicher Intelligenz zu verbessern. Mehrere Quellen berichten, dass diese neue Modellfamilie darauf abzielt, komplexe Probleme in Wissenschaft, Programmierung und Mathematik zu lösen, indem sie mehr Zeit zum „Nachdenken“ aufwendet, bevor sie eine Antwort gibt.

OpenAI stellt Modell o1 vor, um KI-Denkfähigkeiten zu verbessern
Quelle: Selbst erstellt

Fortschrittliches Denkvermögen und Leistung

Das Modell o1 hat bemerkenswerte Fähigkeiten bei der Lösung komplexer Probleme gezeigt, insbesondere in den MINT-Bereichen (Mathematik, Informatik, Naturwissenschaften und Technik). In Tests erreichte o1 das 89. Perzentil bei Programmierwettbewerben (Codeforces) und gehörte zu den Top 500 Schülern in der Qualifikation für die USA Mathematical Olympiad (AIME). In wissenschaftlichen Bereichen wie Physik, Biologie und Chemie übertraf es die Genauigkeit von Menschen mit Doktortitel in einem Benchmark-Datensatz (GPQA). Sein fortschrittliches Denkvermögen ermöglicht es o1, komplizierte Fragen zu beantworten, ausgefeilte Algorithmen zu generieren und sich bei vergleichenden Analyseaufgaben, wie z. B. der Prüfung von Verträgen oder Rechtsdokumenten, hervorzutun.

Leistungs-Benchmarks

Das Modell o1 zeigte herausragende Leistungen in verschiedenen Benchmarks und bewies damit seine fortschrittlichen Denkfähigkeiten. Die folgende Tabelle fasst die wichtigsten Ergebnisse für das Modell o1 zusammen:

Benchmark Leistung
Codeforces (Programmierwettbewerb) 89. Perzentil
AIME (Mathematik-Olympiade-Qualifikation) Top 500 Schüler in den USA
GPQA (Physik, Biologie, Chemie) Übertrifft die Genauigkeit von Personen mit Doktortitel
Internationale Informatik-Olympiade (IOI) 49. Perzentil weltweit
Codeforces Elo-Bewertung 1807 (93. Perzentil)
MMLU-Unterkategorien Übertrifft frühere Modelle in 54 von 57

Die Leistung des Modells o1 ist besonders in den MINT-Bereichen bemerkenswert und demonstriert seine Fähigkeit, komplexe Probleme zu lösen und schwierige Aufgaben logisch zu bearbeiten. Seine Ergebnisse heben die KI-Denkfähigkeiten auf ein neues Niveau und stellen einen bedeutenden Fortschritt für Anwendungen in Wissenschaft, Mathematik und Programmierung dar.

o1-Modellvarianten

Das Modell o1 wurde in zwei Varianten veröffentlicht: o1-preview und o1-mini. Das Modell o1-mini ist kleiner, schneller und kostengünstiger und wurde speziell für Programmieraufgaben entwickelt. Berichten zufolge ist o1-mini 80 % günstiger als o1-preview und bietet gleichzeitig eine wettbewerbsfähige Leistung bei Programmier-Benchmarks. Beide Modelle sind über ChatGPT und die OpenAI-API zugänglich.

Einschränkungen und Herausforderungen

Trotz seiner fortschrittlichen Fähigkeiten steht das Modell o1 vor einigen Herausforderungen. Die Nutzung ist deutlich teurer, wobei die Input-Kosten 3x und die Output-Kosten 4x höher sind als bei GPT-4o über die API. Das Modell o1 kann bei der Verarbeitung von Anfragen manchmal langsamer sein, insbesondere bei komplexen Problemen, die möglicherweise mehr als zehn Sekunden Rechenzeit benötigen. Eine weitere Einschränkung besteht darin, dass o1 derzeit keine Funktionen wie Web-Browsing und Dateianalyse unterstützt, die in anderen KI-Modellen verfügbar sind.

Verfügbarkeit und Zukunftsplanung

Das Modell o1 ist derzeit für ChatGPT Plus- und Team-Nutzer verfügbar, mit begrenzten wöchentlichen Nachrichtenlimits: 30 Nachrichten für o1-preview und 50 Nachrichten für o1-mini. Das Modell o1-mini wird voraussichtlich bald für alle kostenlosen ChatGPT-Nutzer verfügbar sein, obwohl ein konkreter Veröffentlichungstermin noch nicht bekannt gegeben wurde. OpenAI plant, die Fähigkeiten des Modells weiter zu verbessern, seine Einschränkungen zu beheben und zusätzliche Funktionen wie Browsing und Datei-Uploads zu integrieren, um seinen Nutzen in verschiedenen Anwendungen zu erhöhen.

Gábor Bíró 13. September 2024