OpenAI hat einen internen KI-Datenagenten entwickelt, der es den Mitarbeitern ermöglicht, komplexe Datenanalysen in natürlicher Sprache durchzuführen. Eine zentrale Methode, die dabei zum Einsatz kommt, ist das sogenannte „Codex Enrichment“, welches die Codebasis durchforstet, um ein echtes Verständnis der Tabellen zu erlangen. Agentic Vision: Gemini schreibt sich jetzt eigenen Code, um Bilder besser zu verstehen.
Herausforderungen bei der Datensuche
Angesichts von über 70.000 Datensätzen und 600 Petabyte an Daten ist es eine anspruchsvolle Aufgabe, die passende Tabelle zu identifizieren. Ein interner Nutzer von OpenAI äußerte: „Wir haben viele Tabellen, die sich ziemlich ähnlich sind, und ich verbringe sehr viel Zeit damit, herauszufinden, wie sie sich unterscheiden.“ Wie kann Claude Code in einer Stunde Ergebnisse liefern, die Google ein Jahr kosteten?
Technische Einblicke in die Entwicklung
In einem technischen Bericht erläutern die Ingenieure Bonnie Xu, Aravind Suresh und Emma Tang, wie sie dem Agenten ein vertieftes Verständnis für Daten vermitteln. Der entscheidende Aspekt liegt im Code, der zur Erstellung der Tabellen verwendet wird. Forschungsteam präsentiert neues KI-Gedächtnis zur Minimierung von Informationsverlust.