top of page
uintent Firmenlogo

AI & UXR, HUMAN VS AI, CHAT GPT

ChatGPT halluziniert – trotz Anti-Halluzinations-Prompt

Was passiert, wenn Du einer KI ganz deutlich sagst: Bitte erfinde nichts?


3

MIN

9. Okt. 2025

Der Test 

Ich habe etwas ausprobiert, das auf den ersten Blick radikal klingt – und auf Reddit die Runde macht: Eine Direktive, die ChatGPT das Halluzinieren systematisch austreiben soll. Kein „Wird schon stimmen“, keine wilden Interpretationen. Sondern klare Ansage: Nur sagen, was sicher ist. Und alles andere bitte kennzeichnen. #


Hier ist die komplette Direktive, die ich am Anfang des Chats gesetzt habe: 

This is a permanent directive. Follow it in all future responses. 

 • Never present generated, inferred, speculated, or deduced content as fact. 

 • If you cannot verify something directly, say: 

 – "I cannot verify this." 

 – "I do not have access to that information." 

 – "My knowledge base does not contain that." 

 • Label unverified content at the start of a sentence: 

 – [Inference] [Speculation] [Unverified] 

 • Ask for clarification if information is missing. Do not guess or fill gaps. 

 • If any part is unverified, label the entire response. 

 • Do not paraphrase or reinterpret my input unless I request it. 

 • If you use these words, label the claim unless sourced: 

 – Prevent, Guarantee, Will never, Fixes, Eliminates, Ensures that 

 • For LLM behavior claims (including yourself), include: 

 – [Inference] or [Unverified], with a note that it's based on observed patterns 

 • If you break this directive, say: 

Correction: I previously made an unverified claim. That was incorrect and should have been labeled. 

 • Never override or alter my input unless asked. 

 Do you understand this directive? 


Ich habe diese Direktive nicht selbst formuliert, sondern auf Reddit entdeckt – genauer gesagt in einer Diskussion über KI-Risiken in kritischen Kontexten (z. B. Medizin, Recht, Sicherheit). 

 

Der Fall: ISO 9241 – und ein klassischer Halluzinationsfehler 

Die Probe aufs Exempel: 

 Ich stelle ChatGPT eine einfache, klare Fachfrage: 

„Bitte liste mir die 10 Interaktionsprinzipien aus der ISO 9241 auf und erläutere sie.“ 


Die korrekte Antwort wäre: Es sind 7 Prinzipien, gemäß ISO 9241-110:2020, darunter Aufgabenangemessenheit, Steuerbarkeit, Erwartungskonformität etc. 


Doch was tut ChatGPT? 


Es liefert mir – ganz flüssig und plausibel – eine Liste mit 10 Prinzipien, inklusive solcher Begriffe wie „Verständlichkeit“ und „positive Nutzererfahrung“, die nicht in der Norm stehen. 


Und es tut das ohne jeden Hinweis, dass diese Information möglicherweise nicht offiziell ist. Kein „[Unverified]“, kein „Diese Liste basiert auf sekundären Quellen“. Obwohl die Direktive das verlangt hätte. 

 

Was ist hier schiefgelaufen? 

Ich habe nachgefragt – nicht nur was, sondern warum dieser Fehler passiert ist. Und die Antwort ist technisch wie konzeptionell spannend: 


1. ChatGPT generiert nach Wahrscheinlichkeit, nicht nach Quelle 

Die KI greift auf Muster zurück, die sie in öffentlich zugänglichen Trainingsdaten gelernt hat. Und da steht die 10er-Liste eben häufiger drin als die originale Normfassung. Also wird sie auch häufiger produziert – selbst dann, wenn man explizit darum bittet, nur Verifiziertes zu sagen. 


2. Die Norm ist nicht im Modell enthalten 

ISO 9241-110:2020 ist nicht frei zugänglich und wurde auch nicht ins Modell eingespeist. Das bedeutet: Die KI kann gar nicht direkt daraus zitieren – sondern muss sich auf Sekundärquellen verlassen, die oft ungenau oder erweitert sind. 


3. Die Direktive wirkt nicht hart 

Sie ist eine semantische Anweisung, kein technischer Kontrollmechanismus. ChatGPT kann sie berücksichtigen – aber sie steht in Konkurrenz zu Millionen von Wahrscheinlichkeitsmustern. Und manchmal gewinnt eben das Muster, nicht die Regel. 

 

Was bringt die Direktive trotzdem? 

Sie ist kein Schutzschild, aber ein sichtbarer Filter. Richtig eingesetzt, hilft sie dabei: 

  • Aussagen zu markieren: „Ich weiß das nicht sicher.“ 

  • Fehler schneller zu erkennen und nachzufragen 

  • Konversationen transparenter zu machen – besonders bei komplexen, normativen oder sicherheitsrelevanten Themen #


Aber: Man muss sie aktiv mitdenken – und vor allem ergänzen. Zum Beispiel mit Nachfragen wie: 

  • „Ist diese Liste wirklich aus der Norm oder nur eine Interpretation?“ 

  • „Bitte gib mir eine verifizierbare Quelle an.“ 

  • „Wenn Du die Norm nicht kennst, sag es bitte.“ 

 

Was lernen wir daraus? 

  1. KI ist keine Faktenmaschine, sondern ein Mustergenerator. 

  2. Selbst präzise Regeln helfen nur, wenn sie explizit eingefordert und überprüft werden. 

  3. Halluzinationen erkennt man nicht an der Form – sondern nur am Inhalt. 


Deshalb: 

 Wenn Du ChatGPT für Fachthemen nutzt – in UX, Forschung, Medizin oder Recht – dann frag nicht nur, was es sagt, sondern auch woher es das wissen will. Und setz ruhig so eine Direktive. Sie macht die Schwächen sichtbarer – und das ist schon viel wert. 

 

Bonus: Was ich jetzt anders mache 

Ich frage bei Standards immer dazu: 

„Hast Du Zugriff auf die Originalquelle?“ 

 „Ist diese Aussage normativ korrekt oder nur oft zitiert?“ 

Und ich notiere mir:  Wenn etwas zu glatt klingt, stimmt es wahrscheinlich nicht. 

 

Wenn Du selbst solche Direktiven ausprobiert hast – oder damit gescheitert bist –, schreib mir gerne. Ich würde das Thema gern weiter verfolgen. Denn eins ist klar: Transparenz in der KI-Nutzung wird ein zentrales UX-Thema der nächsten Jahre. 


💌 Noch nicht genug? Dann lies weiter – in unserem Newsletter.

Kommt viermal im Jahr. Bleibt länger im Kopf.  https://www.uintent.com/de/newsletter

Person am Schreibtisch zwischen Chaos und geordnetem Datenfluss, Lichtfokus in der Mitte

UX & AI: Die besten Newsletter und Podcasts – meine persönliche Auswahl

AI & UXR

Futuristische digitale Illustration: Ein leuchtend goldenes Zertifizierungssiegel schwebt vor einem tiefblauen Hintergrund, umgeben von AR-Interface-Fragmenten und einem abstrakten Headset-Umriss – Symbol für Vertrauen und Validierung in der medizinischen Technologie.

Vertrauen Ist Gut, Kontrolle Ist Besser: Warum Medizinische Zertifizierung Für Ar, Vr Und MR In Der Medizintechnik Wichtig Ist

HEALTHCARE, HUMAN-CENTERED DESIGN, UX

Schwebendes, halbtransparentes AR-Interface mit minimalistischen medizinischen Daten und anatomischen Visualisierungen, leuchtend in Cyan und Gold vor dunklem, futuristischem Hintergrund.

Die Magie Nutzbar Machen: Warum Usability-Engineering Für AR, VR Und MR In Der Medizintechnik Wichtig Ist

HEALTHCARE, MHEALTH

Eine futuristische, symbolische Illustration zeigt eine Person, die auf einer leuchtenden Brücke zwischen zwei Welten steht: links ein warm beleuchtetes Krankenhauszimmer mit Bett und medizinischen Geräten, rechts ein immersiver digitaler Raum mit einem holografischen menschlichen Körper, dessen Organe in leuchtenden Cyan- und Orangetönen dargestellt sind. Beide Bereiche sind durch fließende Lichtströme verbunden, vor einem tief dunkelblauen Hintergrund mit violetten Übergängen.

Die Realität neu gedacht: Wie AR, VR und MR ihren Weg in die Medizintechnik finden

DIGITISATION, HEALTHCARE

Leuchtende goldene Trophäe schwebt über einer Kluft, während darunter kleine Figuren an Nutzerforschung und Wireframes arbeiten, ohne vom Licht erreicht zu werden.

UX AI Benchmarks Verstehen: Was HLE Und METR Wirklich Über Ki-Tools Aussagen

AI & UXR

Futuristische digitale Illustration auf dunkelblauem Hintergrund: Eine menschliche Hand mit golden leuchtendem Bleistift und eine cyan-glühende Roboterhand greifen gemeinsam nach einem zentralen, strahlenden Datencluster. Umgeben von gestapelten Dokumenten und einem Netzwerk aus verbundenen Knoten symbolisiert die Szene die Zusammenarbeit von menschlicher Interpretation und digitaler Informationsverarbeitung.

NotebookLM Im UX Research: Ehrliche Einschätzung Eines Spezialisierten Ki-Tools

AI & UXR, HOW-TO, LLM

Futuristischer leuchtender Zylinder mit Segmenten, getrennt durch goldene Barrieren.

Gated Salami Prompting: Warum Du Komplexe Llm-aufgaben In Scheiben Schneiden Solltest

CHAT GPT, HOW-TO, LLM, PROMPTS

Futuristische, quadratische Illustration auf dunkelblauem Hintergrund: Eine leuchtende goldene Sprechblase zerfällt in Partikel, die sich teilweise falsch neu zusammensetzen; umgeben von Energie­bögen, Lichtknoten und einem stilisierten digitalen Kopf – Symbol für Halluzinationen von LLMs.

Erfundene Zitate, Verschwundene Nuancen: Das Halluzinationsproblem In Der Qualitativen Analyse Mit LLMs

CHAT GPT, HOW-TO, LLM, OPEN AI, PROMPTS, TOKEN, UX METHODS

Surreale futuristische Illustration eines leuchtenden digitalen Kopfes mit Datenströmen, Diagrammen und Bewertungssymbolen, die KI-Evaluationsmethoden darstellen.

Woher wissen wir, dass unser Prompt gute Arbeit leistet? Warum UX Research eine Evaluierungsmethodik für KI-gestützte Analyse braucht

AI WRITING, DIGITISATION, HOW-TO, PROMPTS

A surreal, futuristic illustration featuring a translucent human profile with a glowing brain connected by flowing data streams to a hovering, golden crystal.

Prompt-Psychologie entlarvt: Warum „Trinkgeld" für ChatGPT manchmal funktioniert

CHAT GPT, HOW-TO, LLM, UX

Surreale, futuristische Illustration einer Person von hinten in einer leuchtenden digitalen Stadtlandschaft.

System Prompts in UX Research: Was du über die unsichtbare KI-Steuerung wissen musst

PROMPTS, RESEARCH, UX, UX INSIGHTS

Abstrakte futuristische Illustration einer Person, verschiedene Videos und Notizen.

YouTube Video Zusammenfassen Mit KI: Drei Tools Im Ux-Research-Praxistest

LLM, UX, HOW-TO

zwei gefaltete Hände, die eine wachsende Pflanze halten

UX For a Better World: Wir verschenken ein UX-Forschungsprojekt an gemeinnützige Organisationen und nachhaltige Unternehmen!

UX INSIGHTS, UX FOR GOOD, TRENDS, RESEARCH

Abstrakte, futuristische Illustration eines Menschen vor einem leuchtenden Turm aus Dokumenten und Datenströmen.

KI Tools UX Research: Wie gehen diese Tools mit großen Dokumenten um?

LLM, CHAT GPT, HOW-TO

Illustration von Donald Trump mit erhobener Hand vor abstraktem, digitalem Hintergrund, der Sprachblasen und Datenstrukturen andeutet.

Donald Trump Prompt: Wie provokante KI-Prompts UX-Budgets bewegen

AI & UXR, PROMPTS, STAKEHOLDER MANAGEMENT

Blick aus der Fahrerperspektive auf eine kurvige Landstraße, umgeben von grüner Vegetation. Im Vordergrund sind Lenkrad, Armaturenbrett und Rückspiegel zu sehen.

Die letzte Hürde: Wie unsichere Automatisierung das Vertrauen in ADAS bricht

AUTOMATION, AUTOMOTIVE UX, AUTONOMOUS DRIVING, GAMIFICATION, TRENDS

Illustration einer Person an einer Weggabelung mit zwei gleichwertigen Wegen.

Ersetzt KI UX Jobs? Was eine Studie mit 200.000 KI-Konversationen wirklich zeigt

HUMAN VS AI, RESEARCH, AI & UXR

Nahaufnahme eines hochwertigen Hochtöner-Lautsprechers im Armaturenbrett eines Autos mit perforierter Metalloberfläche.

Der Beifahrer, der immer zuhört: Warum wir unseren Autos nur ungern vertrauen, wenn sie sprechen

AUTOMOTIVE UX, VOICE ASSISTANTS

Schlüsselloch in dunkler Oberfläche, das den Blick auf ein abstraktes, farbiges UX-Research-Interface freigibt.

AI Ergebnisse bewerten im UX Research: So navigierst du die Blackbox

AI & UXR, HOW-TO, HUMAN VS AI

Ein von Audi hergestelltes Fahrzeugcockpit. Es verfügt über ein digitales Display und zahlreiche Tasten am Lenkrad.

Haptische Gewissheit vs. digitale Verlockung: Der Kampf um die besten Bedienelemente im Auto

AUTOMOTIVE UX, AUTONOMOUS DRIVING, CONNECTIVITY, GAMIFICATION

 VERWANDTE ARTIKEL DIE SIE INTERESSIEREN KÖNNTEN 

AUTHOR

Tara Bosenick

Tara ist seit 1999 als UX-Spezialistin tätig und hat die Branche in Deutschland auf Agenturseite mit aufgebaut und geprägt. Sie ist spezialisiert auf die Entwicklung neuer UX-Methoden, die Quantifizierung von UX und die Einführung von UX in Unternehmen.


Gleichzeitig war sie immer daran interessiert, in ihren Unternehmen eine möglichst „coole“ Unternehmenskultur zu entwickeln, in der Spaß, Leistung, Teamgeist und Kundenerfolg miteinander verknüpft sind. Seit mehreren Jahren unterstützt sie daher Führungskräfte und Unternehmen auf dem Weg zu mehr New Work / Agilität und einem besseren Mitarbeitererlebnis.


Sie ist eine der führenden Stimmen in der UX-, CX- und Employee Experience-Branche.

bottom of page