ChatGPT halluziniert – trotz Anti-Halluzinations-Prompt

AI & UXR, HUMAN VS AI, CHAT GPT

Was passiert, wenn Du einer KI ganz deutlich sagst: Bitte erfinde nichts?

MIN

9. Okt. 2025

Der Test

Ich habe etwas ausprobiert, das auf den ersten Blick radikal klingt – und auf Reddit die Runde macht: Eine Direktive, die ChatGPT das Halluzinieren systematisch austreiben soll. Kein „Wird schon stimmen“, keine wilden Interpretationen. Sondern klare Ansage: Nur sagen, was sicher ist. Und alles andere bitte kennzeichnen. #

Hier ist die komplette Direktive, die ich am Anfang des Chats gesetzt habe:

This is a permanent directive. Follow it in all future responses.

• Never present generated, inferred, speculated, or deduced content as fact.

• If you cannot verify something directly, say:

– "I cannot verify this."

– "I do not have access to that information."

– "My knowledge base does not contain that."

• Label unverified content at the start of a sentence:

– [Inference] [Speculation] [Unverified]

• Ask for clarification if information is missing. Do not guess or fill gaps.

• If any part is unverified, label the entire response.

• Do not paraphrase or reinterpret my input unless I request it.

• If you use these words, label the claim unless sourced:

– Prevent, Guarantee, Will never, Fixes, Eliminates, Ensures that

• For LLM behavior claims (including yourself), include:

– [Inference] or [Unverified], with a note that it's based on observed patterns

• If you break this directive, say:

Correction: I previously made an unverified claim. That was incorrect and should have been labeled.

• Never override or alter my input unless asked.

Do you understand this directive?

Ich habe diese Direktive nicht selbst formuliert, sondern auf Reddit entdeckt – genauer gesagt in einer Diskussion über KI-Risiken in kritischen Kontexten (z. B. Medizin, Recht, Sicherheit).

Der Fall: ISO 9241 – und ein klassischer Halluzinationsfehler

Die Probe aufs Exempel:

Ich stelle ChatGPT eine einfache, klare Fachfrage:

„Bitte liste mir die 10 Interaktionsprinzipien aus der ISO 9241 auf und erläutere sie.“

Die korrekte Antwort wäre: Es sind 7 Prinzipien, gemäß ISO 9241-110:2020, darunter Aufgabenangemessenheit, Steuerbarkeit, Erwartungskonformität etc.

Doch was tut ChatGPT?

Es liefert mir – ganz flüssig und plausibel – eine Liste mit 10 Prinzipien, inklusive solcher Begriffe wie „Verständlichkeit“ und „positive Nutzererfahrung“, die nicht in der Norm stehen.

Und es tut das ohne jeden Hinweis, dass diese Information möglicherweise nicht offiziell ist. Kein „[Unverified]“, kein „Diese Liste basiert auf sekundären Quellen“. Obwohl die Direktive das verlangt hätte.

Was ist hier schiefgelaufen?

Ich habe nachgefragt – nicht nur was, sondern warum dieser Fehler passiert ist. Und die Antwort ist technisch wie konzeptionell spannend:

1. ChatGPT generiert nach Wahrscheinlichkeit, nicht nach Quelle

Die KI greift auf Muster zurück, die sie in öffentlich zugänglichen Trainingsdaten gelernt hat. Und da steht die 10er-Liste eben häufiger drin als die originale Normfassung. Also wird sie auch häufiger produziert – selbst dann, wenn man explizit darum bittet, nur Verifiziertes zu sagen.

2. Die Norm ist nicht im Modell enthalten

ISO 9241-110:2020 ist nicht frei zugänglich und wurde auch nicht ins Modell eingespeist. Das bedeutet: Die KI kann gar nicht direkt daraus zitieren – sondern muss sich auf Sekundärquellen verlassen, die oft ungenau oder erweitert sind.

3. Die Direktive wirkt nicht hart

Sie ist eine semantische Anweisung, kein technischer Kontrollmechanismus. ChatGPT kann sie berücksichtigen – aber sie steht in Konkurrenz zu Millionen von Wahrscheinlichkeitsmustern. Und manchmal gewinnt eben das Muster, nicht die Regel.

Was bringt die Direktive trotzdem?

Sie ist kein Schutzschild, aber ein sichtbarer Filter. Richtig eingesetzt, hilft sie dabei:

Aussagen zu markieren: „Ich weiß das nicht sicher.“
Fehler schneller zu erkennen und nachzufragen
Konversationen transparenter zu machen – besonders bei komplexen, normativen oder sicherheitsrelevanten Themen #

Aber: Man muss sie aktiv mitdenken – und vor allem ergänzen. Zum Beispiel mit Nachfragen wie:

„Ist diese Liste wirklich aus der Norm oder nur eine Interpretation?“
„Bitte gib mir eine verifizierbare Quelle an.“
„Wenn Du die Norm nicht kennst, sag es bitte.“

Was lernen wir daraus?

KI ist keine Faktenmaschine, sondern ein Mustergenerator.
Selbst präzise Regeln helfen nur, wenn sie explizit eingefordert und überprüft werden.
Halluzinationen erkennt man nicht an der Form – sondern nur am Inhalt.

Deshalb:

Wenn Du ChatGPT für Fachthemen nutzt – in UX, Forschung, Medizin oder Recht – dann frag nicht nur, was es sagt, sondern auch woher es das wissen will. Und setz ruhig so eine Direktive. Sie macht die Schwächen sichtbarer – und das ist schon viel wert.

Bonus: Was ich jetzt anders mache

Ich frage bei Standards immer dazu:

„Hast Du Zugriff auf die Originalquelle?“

„Ist diese Aussage normativ korrekt oder nur oft zitiert?“

Und ich notiere mir: Wenn etwas zu glatt klingt, stimmt es wahrscheinlich nicht.

Wenn Du selbst solche Direktiven ausprobiert hast – oder damit gescheitert bist –, schreib mir gerne. Ich würde das Thema gern weiter verfolgen. Denn eins ist klar: Transparenz in der KI-Nutzung wird ein zentrales UX-Thema der nächsten Jahre.

💌 Noch nicht genug? Dann lies weiter – in unserem Newsletter.

Kommt viermal im Jahr. Bleibt länger im Kopf. https://www.uintent.com/de/newsletter

Digitale Illustration einer klassischen Gebäudefassade mit Säulen, gestützt von sichtbarem Gerüst, symbolisiert eine fragile, rein oberflächliche Fassade.

UX & AI: Wie „Ux Potemkin“ Deine Research- UND Design-Entscheidungen Untergräbt

AI & UXR, HUMAN VS AI, LLM, UX

AI & UXR, HUMAN VS AI, CHAT GPT

Was passiert, wenn Du einer KI ganz deutlich sagst: Bitte erfinde nichts?

Der Test

Der Fall: ISO 9241 – und ein klassischer Halluzinationsfehler

Was ist hier schiefgelaufen?

Was bringt die Direktive trotzdem?

Was lernen wir daraus?

Bonus: Was ich jetzt anders mache

UX & AI: Wie „Ux Potemkin“ Deine Research- UND Design-Entscheidungen Untergräbt

Deep Research KI | So nutzt Du ChatGPT sinnvoll für UX-Arbeit

Wie Yupp Feedback nutzt, um KI-Modelle fair zu bewerten – und was UX-Profis daraus lernen können

Prompts kaufen, teilen, verkaufen – was Prompt-Marktplätze heute leisten (und warum das für UX relevant ist)

ChatGPT halluziniert – trotz Anti-Halluzinations-Prompt

Warum KI manchmal nicht bis 3 zählen kann – und was das mit Tokens zu tun hat

GPT-5 ist da: Verändert diese UX AI wirklich alles für Researcher:innen?

Wenn KI Bilder malt und plötzlich richtig schreiben kann

Wenn der Text zu glatt ist: Wie man KI-Sprache menschlicher macht

Kein Science Fiction – KI macht sich selbstständig

Zwischen Argument und Einfluss – Wie überzeugend darf KI sein?

Digital Health Apps & Interfaces: Warum gute UX entscheidet, ob Patienten wirklich profitieren

Zensur trifft KI: Was DeepSeek über Menschenrechte verschweigt – und warum das UX betrifft

Die Voraussetzungen für den Erfolg: Globale Studie zur Logistik in der UX-Forschung für medizinische Geräte

Propaganda Chatbots - Wenn die KI plötzlich russisch spricht

Willkommen im Prompt-Zoo

UX Regulatory Compliance: Warum Usability für Zulassung in MedTech entscheidend ist

Warum Prompts, die Bias und Halluzinationen produzieren, manchmal hilfreich sein können

Global UX Research in Medical Technology: Internationale Nutzerforschung als Erfolgsfaktor

KI, Bias und die Macht der Frage: Wie Du mit klugen Prompts bessere Antworten bekommst

VERWANDTE ARTIKEL DIE SIE INTERESSIEREN KÖNNTEN

AUTHOR