KI News

Neues Framework zeigt: KI-Modelle benötigen menschliche Unterstützung beim Roboter-Coding

2 min Lesezeit
Neues Framework zeigt: KI-Modelle benötigen menschliche Unterstützung beim Roboter-Coding

Ein neu entwickeltes Framework von Nvidia, UC Berkeley und Stanford untersucht eingehend die Fähigkeit von KI-Modellen, Roboter durch selbst generierten Code zu steuern. Die Ergebnisse zeigen, dass selbst die leistungsfähigsten Modelle ohne menschliche Unterstützung nicht in der Lage sind, die Zuverlässigkeit von menschlich verfassten Programmen zu erreichen. Mit gezielter Laufzeit-Skalierung kann jedoch eine Annäherung an diese Lücke erzielt werden.

Die Forscher von Nvidia, UC Berkeley, Stanford und Carnegie Mellon haben mit CaP-X ein Open-Access-Framework ins Leben gerufen, das die Effizienz von KI-Coding-Agenten bei der Steuerung von Robotern durch selbstgeschriebene Programme systematisch analysiert. Bei den Tests erreichten keines der zwölf untersuchten Frontier-Modelle im Einzelversuch die Zuverlässigkeit, die menschlich geschriebene Programme bieten.

Der zentrale Ansatz des Papers besteht darin, anstelle von roboterspezifischen Modellen, die mit umfangreichen Bewegungsdatensätzen trainiert werden, allgemeine Sprachmodelle zur Erstellung von Steuerungscode zu verwenden. Hierbei übertragen die Forscher bewährte Methoden aus der Sprachmodellierung auf die Robotik. Dazu zählen:

  • bestärkendes Lernen mit überprüfbaren Belohnungen aus Physiksimulationen,
  • Skalierung der Rechenzeit durch parallele Lösungsvorschläge,
  • Selbstkorrektur sowie agentische Muster wie automatisches Debugging.

Getestet wurden unter anderem die Modelle Gemini-3-Pro, GPT-5.2, Claude Opus 4.5 sowie mehrere Open-Source-Modelle wie Qwen3-235B und DeepSeek-V3.1. Diese Modelle wurden auf sieben Manipulationsaufgaben geprüft, die von einfachem Würfelheben bis hin zu komplexer beidhändiger Koordination reichen. Interessanterweise zeigen aktuelle Entwicklungen, dass virtuelle Agenten Akrobatik lernen, was die Möglichkeiten der Robotik weiter erweitert. Zudem hat OpenAI neue Modelle vorgestellt, die die Leistungsfähigkeit von KI weiter steigern könnten. Schließlich startet OpenAI einen Wettbewerb zur Entwicklung eines kompakten Sprachmodells, was die Forschung in diesem Bereich vorantreiben dürfte.

„`

Bildquelle: ai-generated-gemini

KI Snack