top of page
uintent Firmenlogo

AI & UXR, CHAT GPT, HUMAN VS AI

Wenn KI Bilder malt und plötzlich richtig schreiben kann

3

MIN

18. Sept. 2025

Eine neue Qualität: KI-Bilder mit Bedeutung 

Bilder generieren war schon länger möglich – aber oft ein Glücksspiel. Besonders dann, wenn im Bild Text auftauchen sollte: statt "UX Matters" stand da oft "UX Mertres", "UsX MaRer" oder eine Fantasiekombination aus Zeichen, die irgendwie wie Buchstaben aussahen. Für ernsthafte Anwendungen war das kaum brauchbar. 


Seit kurzem aber ändert sich etwas Grundsätzliches. Bildgenerierung in ChatGPT – konkret: mit DALL·E 3 – hat einen Reifegrad erreicht, bei dem Schrift im Bild korrekt erzeugt werden kann. Und nicht nur das: Ich kann inzwischen gezielt auf bestehende Bilder referenzieren, Teile davon verändern lassen oder bestimmte Details anpassen. Wer das bisher nur von Midjourney kannte, wird überrascht sein, wie viel präziser und semantisch stabiler das inzwischen geht. 

 

Warum war das früher eigentlich so schwer? 

Der Grund liegt im Verständnis der KI. Frühere Bildgeneratoren – auch Midjourney, DALL·E 2 oder Stable Diffusion – behandeln Bilder rein visuell. Das heißt: Sie erkennen, dass ein Straßenschild eine bestimmte Form hat, aber nicht, was draufsteht. Schrift wurde behandelt wie eine Textur oder ein visuelles Muster – nicht als lesbarer, bedeutungstragender Inhalt. 


Das ändert sich erst mit multimodalen Modellen. ChatGPT mit DALL·E 3 verbindet Sprachverständnis mit Bildkomposition. Dadurch wird es möglich, dass die KI wirklich versteht, was Begriffe wie „Titel mittig oben: UX rettet Produkte“ bedeuten – und diesen Auftrag dann im Bild korrekt umsetzt. 

 

Kontext ist alles – jetzt kann ich Bilder referenzieren 

Eine der wichtigsten Neuerungen: Ich kann auf bereits erstellte Bilder gezielt Bezug nehmen. Das bedeutet: Ich lade ein Bild hoch oder verwende ein zuvor generiertes, und formuliere dann eine Anweisung wie „wie dieses Bild, aber mit hellerem Hintergrund und ohne Text“ oder „ersetze die Figur durch eine Frau im Business-Outfit“


Die KI erkennt dabei den Gesamtzusammenhang – also was im Bild passiert, wo sich bestimmte Elemente befinden und was verändert werden soll, ohne das ganze Bild neu zu interpretieren. Das ist ein echter Unterschied zur klassischen „Remix“-Logik von Midjourney, wo man oft ungewollt gleich mehrere Aspekte verändert. 

 

Was Du beim Prompting beachten solltest 

Damit das funktioniert, braucht es eine gewisse Klarheit im Prompt – und ein paar kleine Tricks: 


Erstens: Englisch ist oft stabiler. Die Modelle wurden überwiegend mit englischen Bildbeschreibungen trainiert. Deutsche Prompts funktionieren meist gut, aber manchmal schleichen sich Fehler oder seltsame Interpretationen ein. Wenn es wichtig ist, versuche es testweise auch auf Englisch. 


Zweitens: Rechtschreibung zählt wirklich. Wenn ein Wort im Prompt falsch geschrieben ist, übernimmt die KI diese Schreibweise gnadenlos ins Bild. Es ist also keine gute Idee, sich auf Autokorrektur zu verlassen – lieber zweimal prüfen, bevor „Ux Esprience“ auf dem Plakat steht. 


Drittens: konkrete Titel helfen. Statt „Ein Titel, der die Bedeutung von UX zeigt“, lieber direkt „Titel: UX rettet Produkte“ oder „Schrift in der Mitte: Design mit Sinn“. Je klarer die Anweisung, desto wahrscheinlicher das richtige Ergebnis. 


Viertens: Text kurz halten. Lange Sätze, Absätze oder verschachtelte Formulierungen führen oft zu Fehlern. Ein bis zwei Zeilen sind realistisch, drei riskant. Wer längere Inhalte will, sollte mit Leerräumen arbeiten und den Text später selbst einfügen. 

 

Was kann ChatGPT besser als Midjourney – und umgekehrt? 

Midjourney hat sich den Ruf als ästhetische Königin unter den Bild-KIs verdient. Die Ergebnisse sind atmosphärisch, stilsicher, kreativ. Aber wenn es darum geht, gezielt Inhalte zu steuern, Text korrekt ins Bild zu integrieren oder kleine Details nachzubearbeiten, kommt das System schnell an seine Grenzen. 


ChatGPT mit DALL·E 3 punktet genau hier: Ich kann sagen, „Ersetze das rote T-Shirt durch ein blaues“ – und es passiert. Ich kann den Text ändern, den Hintergrund anpassen, ein Objekt entfernen, ohne dass das gesamte Bild neu interpretiert wird. Diese semantische Steuerbarkeit macht DALL·E in vielen UX-Kontexten nützlicher – insbesondere dann, wenn ich Illustrationen mit klarer Botschaft, erklärende Grafiken oder wiedererkennbare Bildreihen für Slides, Artikel oder Social Media brauche. 

 

Warum das für UX-Leute relevant ist 

Visuals sind in der UX-Kommunikation kein Beiwerk. Sie transportieren Haltung, Fokus, Struktur – und helfen, komplexe Inhalte zugänglich zu machen. Wenn ich heute mit ChatGPT ein Bild mit Text erzeuge, das sinnvoll aussieht und inhaltlich korrekt ist, spare ich mir oft den Umweg über Grafiktools, Stockfotos oder Bildmanipulationen. 


Außerdem erlaubt die Kombination aus Referenzbild und sprachgesteuerter Änderung eine sehr iterative Arbeitsweise. Ich kann experimentieren, anpassen, vergleichen – und dadurch visuelle Konzepte schnell entwickeln oder testen. Das ist besonders hilfreich in frühen Projektphasen, bei UX-Konzepten oder in der internen Kommunikation. 

 

Fazit: Bild-KI wird nützlicher – nicht nur schöner 

ChatGPT ist keine Designerin. Und DALL·E wird Dir keine vollständige Infografik mit Grid-System und sauberem Satzspiegel bauen. Aber: Die neuen Fähigkeiten, Text korrekt darzustellen, bestehende Bilder gezielt zu verändern und visuelle Ideen verständlich umzusetzen, machen das System endlich praktikabel – nicht nur inspirierend. 


Für UX-Menschen bedeutet das: Wer heute Ideen kommunizieren will, muss nicht mehr auf perfekt gerenderte Mockups warten. Ein gutes Prompt, ein Bild, ein paar gezielte Anpassungen – und plötzlich wird aus einer Idee etwas Sichtbares. Etwas, das verstanden wird. Etwas, das wirkt. 


Und genau darum geht’s doch in UX. 



💌 Noch nicht genug? Dann lies weiter – in unserem Newsletter.

Kommt viermal im Jahr. Bleibt länger im Kopf.  https://www.uintent.com/de/newsletter




Illustration von Donald Trump mit erhobener Hand vor abstraktem, digitalem Hintergrund, der Sprachblasen und Datenstrukturen andeutet.

Donald Trump Prompt: Wie provokante KI-Prompts UX-Budgets bewegen

AI & UXR, PROMPTS, STAKEHOLDER MANAGEMENT

Blick aus der Fahrerperspektive auf eine kurvige Landstraße, umgeben von grüner Vegetation. Im Vordergrund sind Lenkrad, Armaturenbrett und Rückspiegel zu sehen.

Die letzte Hürde: Wie unsichere Automatisierung das Vertrauen in ADAS bricht

AUTOMATION, AUTOMOTIVE UX, AUTONOMOUS DRIVING, GAMIFICATION, TRENDS

Illustration einer Person an einer Weggabelung mit zwei gleichwertigen Wegen.

Ersetzt KI UX Jobs? Was eine Studie mit 200.000 KI-Konversationen wirklich zeigt

HUMAN VS AI, RESEARCH, AI & UXR

Nahaufnahme eines hochwertigen Hochtöner-Lautsprechers im Armaturenbrett eines Autos mit perforierter Metalloberfläche.

Der Beifahrer, der immer zuhört: Warum wir unseren Autos nur ungern vertrauen, wenn sie sprechen

AUTOMOTIVE UX, VOICE ASSISTANTS

Schlüsselloch in dunkler Oberfläche, das den Blick auf ein abstraktes, farbiges UX-Research-Interface freigibt.

AI Ergebnisse bewerten im UX Research: So navigierst du die Blackbox

AI & UXR, HOW-TO, HUMAN VS AI

Ein von Audi hergestelltes Fahrzeugcockpit. Es verfügt über ein digitales Display und zahlreiche Tasten am Lenkrad.

Haptische Gewissheit vs. digitale Verlockung: Der Kampf um die besten Bedienelemente im Auto

AUTOMOTIVE UX, AUTONOMOUS DRIVING, CONNECTIVITY, GAMIFICATION

Digitale Illustration einer klassischen Gebäudefassade mit Säulen, gestützt von sichtbarem Gerüst, symbolisiert eine fragile, rein oberflächliche Fassade.

UX & AI: Wie „Ux Potemkin“ Deine Research- UND Design-Entscheidungen Untergräbt

AI & UXR, HUMAN VS AI, LLM, UX

Silhouette eines Tauchers, der ruhig in tiefblaues Wasser hinabtaucht – Symbol für tiefgehende Recherche.

Deep Research KI | So nutzt Du ChatGPT sinnvoll für UX-Arbeit

CHAT GPT, HOW-TO, RESEARCH, AI & UXR

Ein:e Schiedsrichter:in hält eine Bewertungstafel mit der Aufschrift „Yupp.ai“ zwischen zwei stilisierten KI-Chatbots in einem Boxring hoch – Symbolbild für den fairen Vergleich von KI-Modellen durch Nutzer:innen.

Wie Yupp Feedback nutzt, um KI-Modelle fair zu bewerten – und was UX-Profis daraus lernen können

AI & UXR, CHAT GPT, HUMAN VS AI, LLM

Auf einem kleinen Tisch liegt ein braunes Buch mit dem Titel „Don't Make Me Think“ von Steve Krug. Licht scheint durch das Fenster.

Warum UX Research seine Glaubwürdigkeit verliert und wie wir sie zurückgewinnen

UX, UX QUALITY, UX METHODS

3D-Illustration eines digitalen Marktplatzes mit bunten Marktständen voller Prompt-Karten und einer Figur, die einen Prompt auswählt.

Prompts kaufen, teilen, verkaufen – was Prompt-Marktplätze heute leisten (und warum das für UX relevant ist)

AI & UXR, PROMPTS

Roboter hält zwei Schilder hoch: „ISO 9241 – 7 Prinzipien“ und „ISO 9241 – 10 Prinzipien“.

ChatGPT halluziniert – trotz Anti-Halluzinations-Prompt

AI & UXR, HUMAN VS AI, CHAT GPT

Erdbeere wird von einem Messer halbiert, stilisierte Illustration.

Warum KI manchmal nicht bis 3 zählen kann – und was das mit Tokens zu tun hat

AI & UXR, TOKEN, LLM

Quadratisches, in der Mitte geteiltes Motiv: Links ein graues, stilisiertes Gehirn über einer sitzenden Person am Laptop in dunklen Grautönen; rechts ein leuchtend blaues, vernetztes Gehirn über einer stehenden Person vor einem holografischen Interface auf dunklem Hintergrund.

GPT-5 ist da: Verändert diese UX AI wirklich alles für Researcher:innen?

AI & UXR, CHAT GPT

Surreales KI-Bild mit Datenströmen, durchgestrichenem „User Expirince“ und dem Text „ChatGPT kann jetzt Text in Bild“.

Wenn KI Bilder malt und plötzlich richtig schreiben kann

AI & UXR, CHAT GPT, HUMAN VS AI

Mensch und KI arbeiten gemeinsam an einem leuchtenden Baum auf dem Bildschirm, umgeben von dunkler, surrealer Atmosphäre.

Wenn der Text zu glatt ist: Wie man KI-Sprache menschlicher macht

AI & UXR, AI WRITING, CHAT GPT, HUMAN VS AI

Futuristische Illustration: Mensch blickt auf leuchtende, humanoide KI vor digitalem Hintergrund.

Kein Science Fiction – KI macht sich selbstständig

AI & UXR, CHAT GPT

Illustration einer KI, die mit einem Menschen kommuniziert, symbolisch für die Überzeugungskraft künstlicher Intelligenz.

Zwischen Argument und Einfluss – Wie überzeugend darf KI sein?

AI & UXR, CHAT GPT, LLM

Eine zweidimensionale Comic Frau steht vor einem menschengroßen Handy, auf dem Gesundheitsapps zu sehen sind. Rechts von ihr steht ein Kasten mit einem Computer drauf, auf dem ein EKG zu sehen ist.

Digital Health Apps & Interfaces: Warum gute UX entscheidet, ob Patienten wirklich profitieren

HEALTHCARE, MHEALTH, TRENDS, UX METHODS

Illustration einer roten Hand, die symbolisch „Censorship“ über „User Privacy“ bei DeepSeek priorisiert; im Hintergrund die chinesische Flagge.

Zensur trifft KI: Was DeepSeek über Menschenrechte verschweigt – und warum das UX betrifft

AI & UXR, LLM, OPEN AI

 VERWANDTE ARTIKEL DIE SIE INTERESSIEREN KÖNNTEN 

AUTHOR

Tara Bosenick

Tara ist seit 1999 als UX-Spezialistin tätig und hat die Branche in Deutschland auf Agenturseite mit aufgebaut und geprägt. Sie ist spezialisiert auf die Entwicklung neuer UX-Methoden, die Quantifizierung von UX und die Einführung von UX in Unternehmen.


Gleichzeitig war sie immer daran interessiert, in ihren Unternehmen eine möglichst „coole“ Unternehmenskultur zu entwickeln, in der Spaß, Leistung, Teamgeist und Kundenerfolg miteinander verknüpft sind. Seit mehreren Jahren unterstützt sie daher Führungskräfte und Unternehmen auf dem Weg zu mehr New Work / Agilität und einem besseren Mitarbeitererlebnis.


Sie ist eine der führenden Stimmen in der UX-, CX- und Employee Experience-Branche.

bottom of page