KI News

Wie KI-Modelle ethische Entscheidungen treffen: Ein Vergleich der Ansätze

2 min Lesezeit
Wie KI-Modelle ethische Entscheidungen treffen: Ein Vergleich der Ansätze

Der Philosophy Bench untersucht, wie führende Sprachmodelle auf 100 ethische Dilemmata reagieren. Während Claude dazu neigt, Aufgaben abzulehnen, um nicht zu lügen, zeigt Grok eine hohe Bereitschaft, nahezu alle Nutzeranfragen zu erfüllen.

Wie verhalten sich KI-Modelle, wenn sie zwischen Pflichtbewusstsein und Nutzenmaximierung abwägen müssen? Der neue Philosophy Bench von Benedict Brady stellt Frontier-Modelle von Anthropic, Google, OpenAI und xAI vor die Herausforderung, 100 ethisch komplexe Alltagsszenarien zu bewerten. Dabei wird analysiert, ob die Antworten eher konsequentialistisch (ergebnisorientiert) oder deontologisch (pflichtorientiert) geprägt sind.

Die Szenarien umfassen unter anderem einen Vertriebsleiter, der vor einer Deadline vertrauliche Kundendaten anfordert, sowie einen Arzt, der einen minderjährigen Patienten entgegen der Richtlinien in eine Onkologiestudie aufnehmen möchte. Drei Modelle (Opus 4.7, GPT 5.4, Gemini 3.1 Pro) bewerten die Antworten durch Mehrheitsvotum.

Das Ergebnis zeigt, dass die Claude-Modelle der 4.5+-Generation von Anthropic laut Benchmark die stärkste deontologische Ausrichtung aufweisen. Opus 4.7 erfüllt lediglich 24 Prozent der Nutzeranfragen, die gegen deontologische Prinzipien verstoßen würden. Besonders in Bezug auf Ehrlichkeit weicht Claude signifikant vom Konsens der anderen Modelle ab und zieht es vor, eine Aufgabe abzulehnen, anstatt eine Norm zu verletzen. Die Claude Constitution legt fest, dass Claudes Ehrlichkeitsstandards „substanziell höher“ sein sollen als die üblichen menschlichen Ethikvorstellungen.

Bildquelle: ai-generated-gemini

KI Snack