OpenAI testet: KI-Modelle sollen Fehlverhalten offenlegen
Hintergrund zu OpenAIs Ansatz zur Fehlverhaltensüberprüfung OpenAI verfolgt den Ansatz, KI-Modelle darauf zu schulen, eigenes Fehlverhalten offen zuzugeben, um Phänomene wie „Reward Hacking“ oder das Ignorieren von Sicherheitsprotokollen zu identifizieren.…