Wikipedia hat einen neuen Leitfaden veröffentlicht, der seinen Redakteuren helfen soll, von künstlicher Intelligenz generierte Texte zu erkennen. Das WikiProject AI Cleanup hat eine umfassende Liste von Merkmalen zusammengestellt, die auf KI-generierte Inhalte hindeuten, um die Integrität der Enzyklopädie zu wahren.
Sprachliche Auffälligkeiten von KI-Texten
Der Leitfaden hebt mehrere sprachliche Muster hervor, die typisch für KI-Chatbots sind:
- Überbetonung von Symbolik: Phrasen wie "stands as a testament", "plays a vital role" oder "underscores its importance" werden häufig verwendet.
- Werbesprachliche Formulierungen: Begriffe wie "rich cultural heritage", "breathtaking" oder "stunning natural beauty" verstoßen gegen die Neutralitätsrichtlinien von Wikipedia.
- Redaktionelle Kommentare: Formulierungen wie "it’s important to note" oder "it is worth" können eigene Interpretationen einführen und verstoßen gegen die Richtlinie "No-original-research".
- Übermäßige Konjunktionen: Eine häufige Verwendung von Wörtern wie "moreover", "furthermore" oder "on the other hand" kann auf einen ungeeigneten essayartigen Ton hinweisen.
- Abschnittszusammenfassungen: Phrasen wie "In summary" oder "In conclusion" sind für Wikipedia-Texte unüblich.
Technische Erkennungsmerkmale und Probleme
Neben sprachlichen Indikatoren gibt es auch technische Merkmale, auf die geachtet werden sollte:
- Titelformat in Überschriften: KI-Tools schreiben oft Hauptwörter in Überschriften groß, was von Wikipedias Satzformat abweicht.
- Verwendung von Markdown: Statt Wikitext werden oft Asteriske (*) oder Unterstriche (_) für Formatierungen genutzt.
- "turn0search0"-Artefakte: Spezifische Platzhalter-Codes, die auf Links zu externen Websites hinweisen, wurden bei ChatGPT beobachtet.
- Problematische Quellenangaben: Erfundene oder fehlerhafte Referenzen, defekte Links und ungültige DOIs oder ISBNs sind klare Warnsignale. Eine hohe Rate an 404-Fehlern bei neuen Artikeln kann auf KI-generierte Inhalte hindeuten.
- Versehentliche Preisgabe von KI-Nutzung: Phrasen wie "I hope this helps" oder "Certainly!" deuten auf versehentlich eingefügte Korrespondenz hin. Auch Wissens-Cutoff-Disclaimer wie "as of [date]" sind typisch.
Vorsicht bei der Erkennung
Die Initiatoren des Leitfadens betonen, dass diese Merkmale nicht immer eindeutig auf KI-Nutzung schließen lassen. Da KI-Modelle auf menschlichem Schreiben trainiert werden, können Menschen zufällig ähnliche Schreibstile aufweisen. Daher wird zur Vorsicht geraten und empfohlen, mehrere Indikatoren zu berücksichtigen. Automatische KI-Detektoren wie GPTZero sollten das menschliche Urteilsvermögen nicht ersetzen, auch wenn sie besser als der Zufall funktionieren.