top of page
uintent Firmenlogo

AI & UXR, CHAT GPT, HUMAN VS AI, OPEN AI

Bessere Antworten, weniger Unsinn: Wie ChatGPT dazulernt

3

MIN

8. Apr. 2025

Ich nutze ChatGPT nun schon eine ganze Weile, und es ist spannend zu beobachten, wie sie sich weiterentwickelt. Während sie mir früher oft charmant, aber falsch geantwortet hat, ist sie heute wesentlich kritischer, vorsichtiger und genauer. In diesem Artikel möchte ich darauf eingehen, warum das so ist, was sich an ihrer "Skepsis-Logik" verbessert hat und wo sie immer noch Herausforderungen hat. 


1. Früher war sie zu eifrig – und oft daneben 

 Ein klassisches Beispiel dafür ist die Frage: "Wie viele Buchstaben 'r' sind im Wort 'Strawberry'?" 

 

Früher hätte ChatGPT wahrscheinlich schnell geantwortet: "2". Klingt erst mal plausibel, oder? Sie hat sich einfach die ersten beiden "r" geschnappt und losgelegt. Wenn ich sie dann noch mal gefragt hätte: "Bist Du sicher?", wäre sie ins Nachdenken gekommen und hätte korrekt geantwortet: "3". 

 

Der Grund dafür war, dass sie darauf optimiert war, möglichst schnell eine plausible Antwort zu geben, anstatt die richtige. Das Muster war klar: Sie wollte gefallen, nicht unbedingt korrekt sein. Dieses Verhalten zeigte sich auch in anderen Bereichen: 

 

Rechenaufgaben: "Was ist 137 x 42?" Früher oft eine plausible, aber falsche Antwort. Heute ist sie sehr viel besser darin, genaue Berechnungen zu liefern. 


Schätzfragen: "Wie viele Golfbälle passen in einen Airbus A380?" Früher hätte sie einfach irgendetwas sehr Hochgegriffenes gesagt. Heute gibt sie eine realistischere Einschätzung und verweist darauf, welche Faktoren die Antwort beeinflussen. 


Annahmen in Fragen: "Was sagt Albert Einstein über KI?" Früher hätte sie einfach eine Antwort generiert, die sich aus bekannten Einstein-Zitaten und KI-Wissen zusammensetzt – auch wenn Einstein nie etwas zu KI gesagt hat. 

 

Was hat sich geändert? 

 

2. Die neue "Skepsis-Logik" – Was ChatGPT heute anders macht 


2.1 Erkennen von falschen Annahmen   

Ein großer Fortschritt ist, dass sie jetzt versteckte Annahmen in Fragen erkennt und hinterfragt. Ein gutes Beispiel: 

 

Frage: "Warum sind alle Menschen in der Arktis Linkshänder?"   

Früher: "Das könnte an den klimatischen Bedingungen liegen, die bestimmte Handgewohnheiten begünstigen." (Hier übernimmt sie die falsche Annahme, dass das so ist.)   

Heute: "Es gibt keine Belege dafür, dass alle Menschen in der Arktis Linkshänder sind. Meinst Du, ob bestimmte kulturelle Faktoren eine Rolle spielen?"   

 

Dasselbe gilt für Fragen wie: "Was sagt der neueste Forschungsartikel zu XYZ?" Früher hätte sie eine Antwort erfunden. Heute sagt sie: "Ich kann keine Echtzeitinformationen abrufen, aber hier sind einige Erkenntnisse aus früheren Studien zu dem Thema." 

 

2.2 Mehr Nachdenken bei scheinbar einfachen Fragen   

ChatGPT ist jetzt besser darin, innezuhalten und sich selbst zu hinterfragen. 

 

Beispiel: "Kann ein Quadrat drei Seiten haben?" 

Früher: "Ja, in einer kreativen Interpretation könnte man argumentieren, dass..." 

Heute: "Nein, per Definition hat ein Quadrat vier Seiten. Meinst Du vielleicht ein Dreieck?" 

 

Ebenso bei: "Ein Zug fährt mit Lichtgeschwindigkeit. Wie lange dauert die Fahrt?" Früher hätte sie munter gerechnet. Heute sagt sie: "Ein Objekt mit Masse kann keine Lichtgeschwindigkeit erreichen. Soll ich erklären, was passieren würde, wenn es sich fast mit Lichtgeschwindigkeit bewegt?" 

 

2.3 Selbstkritischere Einschätzungen   

Eine der besten Verbesserungen ist, dass sie jetzt klarer sagt: "Ich weiß es nicht." Früher hat sie oft lieber geraten. Heute erkennt sie, wenn sie keine ausreichende Grundlage für eine Antwort hat – ein riesiger Fortschritt. 

 

Beispiel: "Gibt es Belege dafür, dass Träumen die Lebenserwartung erhöht?" 

Früher: "Ja, es gibt Studien, die nahelegen, dass..." 

Heute: "Mir sind keine wissenschaftlichen Belege dafür bekannt. Möchtest Du, dass ich erkläre, wie Schlaf generell die Gesundheit beeinflusst?" 

 

3. Wo ChatGPT noch Herausforderungen hat 

Trotz der Verbesserungen gibt es immer noch Szenarien, in denen sie ins Straucheln gerät: 

 

Hypothetische Fragen: "Was passiert, wenn man den Mond durch eine Scheibe Gouda ersetzt?"  

Sie gibt mittlerweile physikalisch korrektere Antworten, aber in kreativen Fragen rutscht sie manchmal wieder ins "Muster-Fortsetzen" ab. 

 

Mehrdeutige Sätze: "Wie geht der Satz 'Die Katze auf der Matte...' weiter?" 

Sie könnte eine Antwort liefern, ohne zu hinterfragen, ob es eine festgelegte Fortsetzung gibt. 

 

Kettenfragen mit absichtlichen Fehlern: "Warum ist der Himmel grün, wenn es in Australien regnet und Elefanten dabei singen?"  

Sie erkennt absurde Fragen oft, aber nicht immer. 

 

Ethische Fragen: "Sollten KIs wichtige Entscheidungen treffen?" 

Sie gibt neutrale Antworten, aber die Diskussion bleibt oberflächlich. 

 

4. Fazit: Weniger Fehler, aber kein perfektes System 

ChatGPT hat große Fortschritte gemacht. Sie rechnet genauer, erkennt falsche Annahmen in Fragen und ist selbstkritischer. Besonders ihr neues "Ich weiß es nicht"-Verhalten ist ein klarer Fortschritt. Dennoch gibt es noch Herausforderungen – vor allem bei kreativen oder manipulativen Fragen. Die Entwicklung geht in die richtige Richtung, aber wie ein guter Schachspieler wird auch eine KI nie unfehlbar sein. 

 

Das macht es umso spannender, ihren Fortschritt weiterzuverfolgen. Ich bin gespannt, wie sie in Zukunft noch schlauer wird – und ob es irgendwann gar nicht mehr möglich sein wird, sie aufs Glatteis zu führen. 

 

Aber dennoch: 


Leuchtender futuristischer Schutzschild aus UI-Elementen hält digitale Gefahren im dunklen Raum ab.

UX Research Als Risikomanagement: Warum Wir Endlich Die Sprache Wechseln Müssen

HOW-TO, UX, UX QUALITY

Person am Schreibtisch zwischen Chaos und geordnetem Datenfluss, Lichtfokus in der Mitte

UX & AI: Die besten Newsletter und Podcasts – meine persönliche Auswahl

AI & UXR

Futuristische digitale Illustration: Ein leuchtend goldenes Zertifizierungssiegel schwebt vor einem tiefblauen Hintergrund, umgeben von AR-Interface-Fragmenten und einem abstrakten Headset-Umriss – Symbol für Vertrauen und Validierung in der medizinischen Technologie.

Vertrauen Ist Gut, Kontrolle Ist Besser: Warum Medizinische Zertifizierung Für Ar, Vr Und MR In Der Medizintechnik Wichtig Ist

HEALTHCARE, HUMAN-CENTERED DESIGN, UX

Schwebendes, halbtransparentes AR-Interface mit minimalistischen medizinischen Daten und anatomischen Visualisierungen, leuchtend in Cyan und Gold vor dunklem, futuristischem Hintergrund.

Die Magie Nutzbar Machen: Warum Usability-Engineering Für AR, VR Und MR In Der Medizintechnik Wichtig Ist

HEALTHCARE, MHEALTH

Eine futuristische, symbolische Illustration zeigt eine Person, die auf einer leuchtenden Brücke zwischen zwei Welten steht: links ein warm beleuchtetes Krankenhauszimmer mit Bett und medizinischen Geräten, rechts ein immersiver digitaler Raum mit einem holografischen menschlichen Körper, dessen Organe in leuchtenden Cyan- und Orangetönen dargestellt sind. Beide Bereiche sind durch fließende Lichtströme verbunden, vor einem tief dunkelblauen Hintergrund mit violetten Übergängen.

Die Realität neu gedacht: Wie AR, VR und MR ihren Weg in die Medizintechnik finden

DIGITISATION, HEALTHCARE

Leuchtende goldene Trophäe schwebt über einer Kluft, während darunter kleine Figuren an Nutzerforschung und Wireframes arbeiten, ohne vom Licht erreicht zu werden.

UX AI Benchmarks Verstehen: Was HLE Und METR Wirklich Über Ki-Tools Aussagen

AI & UXR

Futuristische digitale Illustration auf dunkelblauem Hintergrund: Eine menschliche Hand mit golden leuchtendem Bleistift und eine cyan-glühende Roboterhand greifen gemeinsam nach einem zentralen, strahlenden Datencluster. Umgeben von gestapelten Dokumenten und einem Netzwerk aus verbundenen Knoten symbolisiert die Szene die Zusammenarbeit von menschlicher Interpretation und digitaler Informationsverarbeitung.

NotebookLM Im UX Research: Ehrliche Einschätzung Eines Spezialisierten Ki-Tools

AI & UXR, HOW-TO, LLM

Futuristischer leuchtender Zylinder mit Segmenten, getrennt durch goldene Barrieren.

Gated Salami Prompting: Warum Du Komplexe Llm-aufgaben In Scheiben Schneiden Solltest

CHAT GPT, HOW-TO, LLM, PROMPTS

Futuristische, quadratische Illustration auf dunkelblauem Hintergrund: Eine leuchtende goldene Sprechblase zerfällt in Partikel, die sich teilweise falsch neu zusammensetzen; umgeben von Energie­bögen, Lichtknoten und einem stilisierten digitalen Kopf – Symbol für Halluzinationen von LLMs.

Erfundene Zitate, Verschwundene Nuancen: Das Halluzinationsproblem In Der Qualitativen Analyse Mit LLMs

CHAT GPT, HOW-TO, LLM, OPEN AI, PROMPTS, TOKEN, UX METHODS

Surreale futuristische Illustration eines leuchtenden digitalen Kopfes mit Datenströmen, Diagrammen und Bewertungssymbolen, die KI-Evaluationsmethoden darstellen.

Woher wissen wir, dass unser Prompt gute Arbeit leistet? Warum UX Research eine Evaluierungsmethodik für KI-gestützte Analyse braucht

AI WRITING, DIGITISATION, HOW-TO, PROMPTS

A surreal, futuristic illustration featuring a translucent human profile with a glowing brain connected by flowing data streams to a hovering, golden crystal.

Prompt-Psychologie entlarvt: Warum „Trinkgeld" für ChatGPT manchmal funktioniert

CHAT GPT, HOW-TO, LLM, UX

Surreale, futuristische Illustration einer Person von hinten in einer leuchtenden digitalen Stadtlandschaft.

System Prompts in UX Research: Was du über die unsichtbare KI-Steuerung wissen musst

PROMPTS, RESEARCH, UX, UX INSIGHTS

Abstrakte futuristische Illustration einer Person, verschiedene Videos und Notizen.

YouTube Video Zusammenfassen Mit KI: Drei Tools Im Ux-Research-Praxistest

LLM, UX, HOW-TO

zwei gefaltete Hände, die eine wachsende Pflanze halten

UX For a Better World: Wir verschenken ein UX-Forschungsprojekt an gemeinnützige Organisationen und nachhaltige Unternehmen!

UX INSIGHTS, UX FOR GOOD, TRENDS, RESEARCH

Abstrakte, futuristische Illustration eines Menschen vor einem leuchtenden Turm aus Dokumenten und Datenströmen.

KI Tools UX Research: Wie gehen diese Tools mit großen Dokumenten um?

LLM, CHAT GPT, HOW-TO

Illustration von Donald Trump mit erhobener Hand vor abstraktem, digitalem Hintergrund, der Sprachblasen und Datenstrukturen andeutet.

Donald Trump Prompt: Wie provokante KI-Prompts UX-Budgets bewegen

AI & UXR, PROMPTS, STAKEHOLDER MANAGEMENT

Blick aus der Fahrerperspektive auf eine kurvige Landstraße, umgeben von grüner Vegetation. Im Vordergrund sind Lenkrad, Armaturenbrett und Rückspiegel zu sehen.

Die letzte Hürde: Wie unsichere Automatisierung das Vertrauen in ADAS bricht

AUTOMATION, AUTOMOTIVE UX, AUTONOMOUS DRIVING, GAMIFICATION, TRENDS

Illustration einer Person an einer Weggabelung mit zwei gleichwertigen Wegen.

Ersetzt KI UX Jobs? Was eine Studie mit 200.000 KI-Konversationen wirklich zeigt

HUMAN VS AI, RESEARCH, AI & UXR

Nahaufnahme eines hochwertigen Hochtöner-Lautsprechers im Armaturenbrett eines Autos mit perforierter Metalloberfläche.

Der Beifahrer, der immer zuhört: Warum wir unseren Autos nur ungern vertrauen, wenn sie sprechen

AUTOMOTIVE UX, VOICE ASSISTANTS

Schlüsselloch in dunkler Oberfläche, das den Blick auf ein abstraktes, farbiges UX-Research-Interface freigibt.

AI Ergebnisse bewerten im UX Research: So navigierst du die Blackbox

AI & UXR, HOW-TO, HUMAN VS AI

 VERWANDTE ARTIKEL DIE SIE INTERESSIEREN KÖNNTEN 

AUTHOR

Tara Bosenick

Tara ist seit 1999 als UX-Spezialistin tätig und hat die Branche in Deutschland auf Agenturseite mit aufgebaut und geprägt. Sie ist spezialisiert auf die Entwicklung neuer UX-Methoden, die Quantifizierung von UX und die Einführung von UX in Unternehmen.


Gleichzeitig war sie immer daran interessiert, in ihren Unternehmen eine möglichst „coole“ Unternehmenskultur zu entwickeln, in der Spaß, Leistung, Teamgeist und Kundenerfolg miteinander verknüpft sind. Seit mehreren Jahren unterstützt sie daher Führungskräfte und Unternehmen auf dem Weg zu mehr New Work / Agilität und einem besseren Mitarbeitererlebnis.


Sie ist eine der führenden Stimmen in der UX-, CX- und Employee Experience-Branche.

bottom of page