Älteres OpenAI-Modell o3 schlägt GPT-5 bei komplexen Büroaufgaben
Ein neuer Benchmark namens OdysseyBench hat die Leistung von KI-Agenten in komplexen, mehrtägigen Büroaufgaben untersucht. Überraschenderweise übertrifft OpenAIs älteres Modell o3 in vielen dieser Szenarien das neuere GPT-5-Modell. Dies deutet…