top of page
uintent Firmenlogo

AI & UXR, CHAT GPT, HUMAN VS AI

Wenn KI Bilder malt und plötzlich richtig schreiben kann

3

MIN

18. Sept. 2025

Eine neue Qualität: KI-Bilder mit Bedeutung 

Bilder generieren war schon länger möglich – aber oft ein Glücksspiel. Besonders dann, wenn im Bild Text auftauchen sollte: statt "UX Matters" stand da oft "UX Mertres", "UsX MaRer" oder eine Fantasiekombination aus Zeichen, die irgendwie wie Buchstaben aussahen. Für ernsthafte Anwendungen war das kaum brauchbar. 


Seit kurzem aber ändert sich etwas Grundsätzliches. Bildgenerierung in ChatGPT – konkret: mit DALL·E 3 – hat einen Reifegrad erreicht, bei dem Schrift im Bild korrekt erzeugt werden kann. Und nicht nur das: Ich kann inzwischen gezielt auf bestehende Bilder referenzieren, Teile davon verändern lassen oder bestimmte Details anpassen. Wer das bisher nur von Midjourney kannte, wird überrascht sein, wie viel präziser und semantisch stabiler das inzwischen geht. 

 

Warum war das früher eigentlich so schwer? 

Der Grund liegt im Verständnis der KI. Frühere Bildgeneratoren – auch Midjourney, DALL·E 2 oder Stable Diffusion – behandeln Bilder rein visuell. Das heißt: Sie erkennen, dass ein Straßenschild eine bestimmte Form hat, aber nicht, was draufsteht. Schrift wurde behandelt wie eine Textur oder ein visuelles Muster – nicht als lesbarer, bedeutungstragender Inhalt. 


Das ändert sich erst mit multimodalen Modellen. ChatGPT mit DALL·E 3 verbindet Sprachverständnis mit Bildkomposition. Dadurch wird es möglich, dass die KI wirklich versteht, was Begriffe wie „Titel mittig oben: UX rettet Produkte“ bedeuten – und diesen Auftrag dann im Bild korrekt umsetzt. 

 

Kontext ist alles – jetzt kann ich Bilder referenzieren 

Eine der wichtigsten Neuerungen: Ich kann auf bereits erstellte Bilder gezielt Bezug nehmen. Das bedeutet: Ich lade ein Bild hoch oder verwende ein zuvor generiertes, und formuliere dann eine Anweisung wie „wie dieses Bild, aber mit hellerem Hintergrund und ohne Text“ oder „ersetze die Figur durch eine Frau im Business-Outfit“


Die KI erkennt dabei den Gesamtzusammenhang – also was im Bild passiert, wo sich bestimmte Elemente befinden und was verändert werden soll, ohne das ganze Bild neu zu interpretieren. Das ist ein echter Unterschied zur klassischen „Remix“-Logik von Midjourney, wo man oft ungewollt gleich mehrere Aspekte verändert. 

 

Was Du beim Prompting beachten solltest 

Damit das funktioniert, braucht es eine gewisse Klarheit im Prompt – und ein paar kleine Tricks: 


Erstens: Englisch ist oft stabiler. Die Modelle wurden überwiegend mit englischen Bildbeschreibungen trainiert. Deutsche Prompts funktionieren meist gut, aber manchmal schleichen sich Fehler oder seltsame Interpretationen ein. Wenn es wichtig ist, versuche es testweise auch auf Englisch. 


Zweitens: Rechtschreibung zählt wirklich. Wenn ein Wort im Prompt falsch geschrieben ist, übernimmt die KI diese Schreibweise gnadenlos ins Bild. Es ist also keine gute Idee, sich auf Autokorrektur zu verlassen – lieber zweimal prüfen, bevor „Ux Esprience“ auf dem Plakat steht. 


Drittens: konkrete Titel helfen. Statt „Ein Titel, der die Bedeutung von UX zeigt“, lieber direkt „Titel: UX rettet Produkte“ oder „Schrift in der Mitte: Design mit Sinn“. Je klarer die Anweisung, desto wahrscheinlicher das richtige Ergebnis. 


Viertens: Text kurz halten. Lange Sätze, Absätze oder verschachtelte Formulierungen führen oft zu Fehlern. Ein bis zwei Zeilen sind realistisch, drei riskant. Wer längere Inhalte will, sollte mit Leerräumen arbeiten und den Text später selbst einfügen. 

 

Was kann ChatGPT besser als Midjourney – und umgekehrt? 

Midjourney hat sich den Ruf als ästhetische Königin unter den Bild-KIs verdient. Die Ergebnisse sind atmosphärisch, stilsicher, kreativ. Aber wenn es darum geht, gezielt Inhalte zu steuern, Text korrekt ins Bild zu integrieren oder kleine Details nachzubearbeiten, kommt das System schnell an seine Grenzen. 


ChatGPT mit DALL·E 3 punktet genau hier: Ich kann sagen, „Ersetze das rote T-Shirt durch ein blaues“ – und es passiert. Ich kann den Text ändern, den Hintergrund anpassen, ein Objekt entfernen, ohne dass das gesamte Bild neu interpretiert wird. Diese semantische Steuerbarkeit macht DALL·E in vielen UX-Kontexten nützlicher – insbesondere dann, wenn ich Illustrationen mit klarer Botschaft, erklärende Grafiken oder wiedererkennbare Bildreihen für Slides, Artikel oder Social Media brauche. 

 

Warum das für UX-Leute relevant ist 

Visuals sind in der UX-Kommunikation kein Beiwerk. Sie transportieren Haltung, Fokus, Struktur – und helfen, komplexe Inhalte zugänglich zu machen. Wenn ich heute mit ChatGPT ein Bild mit Text erzeuge, das sinnvoll aussieht und inhaltlich korrekt ist, spare ich mir oft den Umweg über Grafiktools, Stockfotos oder Bildmanipulationen. 


Außerdem erlaubt die Kombination aus Referenzbild und sprachgesteuerter Änderung eine sehr iterative Arbeitsweise. Ich kann experimentieren, anpassen, vergleichen – und dadurch visuelle Konzepte schnell entwickeln oder testen. Das ist besonders hilfreich in frühen Projektphasen, bei UX-Konzepten oder in der internen Kommunikation. 

 

Fazit: Bild-KI wird nützlicher – nicht nur schöner 

ChatGPT ist keine Designerin. Und DALL·E wird Dir keine vollständige Infografik mit Grid-System und sauberem Satzspiegel bauen. Aber: Die neuen Fähigkeiten, Text korrekt darzustellen, bestehende Bilder gezielt zu verändern und visuelle Ideen verständlich umzusetzen, machen das System endlich praktikabel – nicht nur inspirierend. 


Für UX-Menschen bedeutet das: Wer heute Ideen kommunizieren will, muss nicht mehr auf perfekt gerenderte Mockups warten. Ein gutes Prompt, ein Bild, ein paar gezielte Anpassungen – und plötzlich wird aus einer Idee etwas Sichtbares. Etwas, das verstanden wird. Etwas, das wirkt. 


Und genau darum geht’s doch in UX. 



💌 Noch nicht genug? Dann lies weiter – in unserem Newsletter.

Kommt viermal im Jahr. Bleibt länger im Kopf.  https://www.uintent.com/de/newsletter




Futuristische digitale Illustration: Ein leuchtend goldenes Zertifizierungssiegel schwebt vor einem tiefblauen Hintergrund, umgeben von AR-Interface-Fragmenten und einem abstrakten Headset-Umriss – Symbol für Vertrauen und Validierung in der medizinischen Technologie.

Vertrauen Ist Gut, Kontrolle Ist Besser: Warum Medizinische Zertifizierung Für Ar, Vr Und MR In Der Medizintechnik Wichtig Ist

HEALTHCARE, HUMAN-CENTERED DESIGN, UX

Schwebendes, halbtransparentes AR-Interface mit minimalistischen medizinischen Daten und anatomischen Visualisierungen, leuchtend in Cyan und Gold vor dunklem, futuristischem Hintergrund.

Die Magie Nutzbar Machen: Warum Usability-Engineering Für AR, VR Und MR In Der Medizintechnik Wichtig Ist

HEALTHCARE, MHEALTH

Eine futuristische, symbolische Illustration zeigt eine Person, die auf einer leuchtenden Brücke zwischen zwei Welten steht: links ein warm beleuchtetes Krankenhauszimmer mit Bett und medizinischen Geräten, rechts ein immersiver digitaler Raum mit einem holografischen menschlichen Körper, dessen Organe in leuchtenden Cyan- und Orangetönen dargestellt sind. Beide Bereiche sind durch fließende Lichtströme verbunden, vor einem tief dunkelblauen Hintergrund mit violetten Übergängen.

Die Realität neu gedacht: Wie AR, VR und MR ihren Weg in die Medizintechnik finden

DIGITISATION, HEALTHCARE

Leuchtende goldene Trophäe schwebt über einer Kluft, während darunter kleine Figuren an Nutzerforschung und Wireframes arbeiten, ohne vom Licht erreicht zu werden.

UX AI Benchmarks Verstehen: Was HLE Und METR Wirklich Über Ki-Tools Aussagen

AI & UXR

Futuristische digitale Illustration auf dunkelblauem Hintergrund: Eine menschliche Hand mit golden leuchtendem Bleistift und eine cyan-glühende Roboterhand greifen gemeinsam nach einem zentralen, strahlenden Datencluster. Umgeben von gestapelten Dokumenten und einem Netzwerk aus verbundenen Knoten symbolisiert die Szene die Zusammenarbeit von menschlicher Interpretation und digitaler Informationsverarbeitung.

NotebookLM Im UX Research: Ehrliche Einschätzung Eines Spezialisierten Ki-Tools

AI & UXR, HOW-TO, LLM

Futuristischer leuchtender Zylinder mit Segmenten, getrennt durch goldene Barrieren.

Gated Salami Prompting: Warum Du Komplexe Llm-aufgaben In Scheiben Schneiden Solltest

CHAT GPT, HOW-TO, LLM, PROMPTS

Futuristische, quadratische Illustration auf dunkelblauem Hintergrund: Eine leuchtende goldene Sprechblase zerfällt in Partikel, die sich teilweise falsch neu zusammensetzen; umgeben von Energie­bögen, Lichtknoten und einem stilisierten digitalen Kopf – Symbol für Halluzinationen von LLMs.

Erfundene Zitate, Verschwundene Nuancen: Das Halluzinationsproblem In Der Qualitativen Analyse Mit LLMs

CHAT GPT, HOW-TO, LLM, OPEN AI, PROMPTS, TOKEN, UX METHODS

Surreale futuristische Illustration eines leuchtenden digitalen Kopfes mit Datenströmen, Diagrammen und Bewertungssymbolen, die KI-Evaluationsmethoden darstellen.

Woher wissen wir, dass unser Prompt gute Arbeit leistet? Warum UX Research eine Evaluierungsmethodik für KI-gestützte Analyse braucht

AI WRITING, DIGITISATION, HOW-TO, PROMPTS

A surreal, futuristic illustration featuring a translucent human profile with a glowing brain connected by flowing data streams to a hovering, golden crystal.

Prompt-Psychologie entlarvt: Warum „Trinkgeld" für ChatGPT manchmal funktioniert

CHAT GPT, HOW-TO, LLM, UX

Surreale, futuristische Illustration einer Person von hinten in einer leuchtenden digitalen Stadtlandschaft.

System Prompts in UX Research: Was du über die unsichtbare KI-Steuerung wissen musst

PROMPTS, RESEARCH, UX, UX INSIGHTS

Abstrakte futuristische Illustration einer Person, verschiedene Videos und Notizen.

YouTube Video Zusammenfassen Mit KI: Drei Tools Im Ux-Research-Praxistest

LLM, UX, HOW-TO

zwei gefaltete Hände, die eine wachsende Pflanze halten

UX For a Better World: Wir verschenken ein UX-Forschungsprojekt an gemeinnützige Organisationen und nachhaltige Unternehmen!

UX INSIGHTS, UX FOR GOOD, TRENDS, RESEARCH

Abstrakte, futuristische Illustration eines Menschen vor einem leuchtenden Turm aus Dokumenten und Datenströmen.

KI Tools UX Research: Wie gehen diese Tools mit großen Dokumenten um?

LLM, CHAT GPT, HOW-TO

Illustration von Donald Trump mit erhobener Hand vor abstraktem, digitalem Hintergrund, der Sprachblasen und Datenstrukturen andeutet.

Donald Trump Prompt: Wie provokante KI-Prompts UX-Budgets bewegen

AI & UXR, PROMPTS, STAKEHOLDER MANAGEMENT

Blick aus der Fahrerperspektive auf eine kurvige Landstraße, umgeben von grüner Vegetation. Im Vordergrund sind Lenkrad, Armaturenbrett und Rückspiegel zu sehen.

Die letzte Hürde: Wie unsichere Automatisierung das Vertrauen in ADAS bricht

AUTOMATION, AUTOMOTIVE UX, AUTONOMOUS DRIVING, GAMIFICATION, TRENDS

Illustration einer Person an einer Weggabelung mit zwei gleichwertigen Wegen.

Ersetzt KI UX Jobs? Was eine Studie mit 200.000 KI-Konversationen wirklich zeigt

HUMAN VS AI, RESEARCH, AI & UXR

Nahaufnahme eines hochwertigen Hochtöner-Lautsprechers im Armaturenbrett eines Autos mit perforierter Metalloberfläche.

Der Beifahrer, der immer zuhört: Warum wir unseren Autos nur ungern vertrauen, wenn sie sprechen

AUTOMOTIVE UX, VOICE ASSISTANTS

Schlüsselloch in dunkler Oberfläche, das den Blick auf ein abstraktes, farbiges UX-Research-Interface freigibt.

AI Ergebnisse bewerten im UX Research: So navigierst du die Blackbox

AI & UXR, HOW-TO, HUMAN VS AI

Ein von Audi hergestelltes Fahrzeugcockpit. Es verfügt über ein digitales Display und zahlreiche Tasten am Lenkrad.

Haptische Gewissheit vs. digitale Verlockung: Der Kampf um die besten Bedienelemente im Auto

AUTOMOTIVE UX, AUTONOMOUS DRIVING, CONNECTIVITY, GAMIFICATION

Digitale Illustration einer klassischen Gebäudefassade mit Säulen, gestützt von sichtbarem Gerüst, symbolisiert eine fragile, rein oberflächliche Fassade.

UX & AI: Wie „Ux Potemkin“ Deine Research- UND Design-Entscheidungen Untergräbt

AI & UXR, HUMAN VS AI, LLM, UX

 VERWANDTE ARTIKEL DIE SIE INTERESSIEREN KÖNNTEN 

AUTHOR

Tara Bosenick

Tara ist seit 1999 als UX-Spezialistin tätig und hat die Branche in Deutschland auf Agenturseite mit aufgebaut und geprägt. Sie ist spezialisiert auf die Entwicklung neuer UX-Methoden, die Quantifizierung von UX und die Einführung von UX in Unternehmen.


Gleichzeitig war sie immer daran interessiert, in ihren Unternehmen eine möglichst „coole“ Unternehmenskultur zu entwickeln, in der Spaß, Leistung, Teamgeist und Kundenerfolg miteinander verknüpft sind. Seit mehreren Jahren unterstützt sie daher Führungskräfte und Unternehmen auf dem Weg zu mehr New Work / Agilität und einem besseren Mitarbeitererlebnis.


Sie ist eine der führenden Stimmen in der UX-, CX- und Employee Experience-Branche.

bottom of page