top of page
uintent Firmenlogo

AI & UXR, CHAT GPT, HUMAN VS AI

Wenn KI Bilder malt und plötzlich richtig schreiben kann

3

MIN

18. Sept. 2025

Eine neue Qualität: KI-Bilder mit Bedeutung 

Bilder generieren war schon länger möglich – aber oft ein Glücksspiel. Besonders dann, wenn im Bild Text auftauchen sollte: statt "UX Matters" stand da oft "UX Mertres", "UsX MaRer" oder eine Fantasiekombination aus Zeichen, die irgendwie wie Buchstaben aussahen. Für ernsthafte Anwendungen war das kaum brauchbar. 


Seit kurzem aber ändert sich etwas Grundsätzliches. Bildgenerierung in ChatGPT – konkret: mit DALL·E 3 – hat einen Reifegrad erreicht, bei dem Schrift im Bild korrekt erzeugt werden kann. Und nicht nur das: Ich kann inzwischen gezielt auf bestehende Bilder referenzieren, Teile davon verändern lassen oder bestimmte Details anpassen. Wer das bisher nur von Midjourney kannte, wird überrascht sein, wie viel präziser und semantisch stabiler das inzwischen geht. 

 

Warum war das früher eigentlich so schwer? 

Der Grund liegt im Verständnis der KI. Frühere Bildgeneratoren – auch Midjourney, DALL·E 2 oder Stable Diffusion – behandeln Bilder rein visuell. Das heißt: Sie erkennen, dass ein Straßenschild eine bestimmte Form hat, aber nicht, was draufsteht. Schrift wurde behandelt wie eine Textur oder ein visuelles Muster – nicht als lesbarer, bedeutungstragender Inhalt. 


Das ändert sich erst mit multimodalen Modellen. ChatGPT mit DALL·E 3 verbindet Sprachverständnis mit Bildkomposition. Dadurch wird es möglich, dass die KI wirklich versteht, was Begriffe wie „Titel mittig oben: UX rettet Produkte“ bedeuten – und diesen Auftrag dann im Bild korrekt umsetzt. 

 

Kontext ist alles – jetzt kann ich Bilder referenzieren 

Eine der wichtigsten Neuerungen: Ich kann auf bereits erstellte Bilder gezielt Bezug nehmen. Das bedeutet: Ich lade ein Bild hoch oder verwende ein zuvor generiertes, und formuliere dann eine Anweisung wie „wie dieses Bild, aber mit hellerem Hintergrund und ohne Text“ oder „ersetze die Figur durch eine Frau im Business-Outfit“


Die KI erkennt dabei den Gesamtzusammenhang – also was im Bild passiert, wo sich bestimmte Elemente befinden und was verändert werden soll, ohne das ganze Bild neu zu interpretieren. Das ist ein echter Unterschied zur klassischen „Remix“-Logik von Midjourney, wo man oft ungewollt gleich mehrere Aspekte verändert. 

 

Was Du beim Prompting beachten solltest 

Damit das funktioniert, braucht es eine gewisse Klarheit im Prompt – und ein paar kleine Tricks: 


Erstens: Englisch ist oft stabiler. Die Modelle wurden überwiegend mit englischen Bildbeschreibungen trainiert. Deutsche Prompts funktionieren meist gut, aber manchmal schleichen sich Fehler oder seltsame Interpretationen ein. Wenn es wichtig ist, versuche es testweise auch auf Englisch. 


Zweitens: Rechtschreibung zählt wirklich. Wenn ein Wort im Prompt falsch geschrieben ist, übernimmt die KI diese Schreibweise gnadenlos ins Bild. Es ist also keine gute Idee, sich auf Autokorrektur zu verlassen – lieber zweimal prüfen, bevor „Ux Esprience“ auf dem Plakat steht. 


Drittens: konkrete Titel helfen. Statt „Ein Titel, der die Bedeutung von UX zeigt“, lieber direkt „Titel: UX rettet Produkte“ oder „Schrift in der Mitte: Design mit Sinn“. Je klarer die Anweisung, desto wahrscheinlicher das richtige Ergebnis. 


Viertens: Text kurz halten. Lange Sätze, Absätze oder verschachtelte Formulierungen führen oft zu Fehlern. Ein bis zwei Zeilen sind realistisch, drei riskant. Wer längere Inhalte will, sollte mit Leerräumen arbeiten und den Text später selbst einfügen. 

 

Was kann ChatGPT besser als Midjourney – und umgekehrt? 

Midjourney hat sich den Ruf als ästhetische Königin unter den Bild-KIs verdient. Die Ergebnisse sind atmosphärisch, stilsicher, kreativ. Aber wenn es darum geht, gezielt Inhalte zu steuern, Text korrekt ins Bild zu integrieren oder kleine Details nachzubearbeiten, kommt das System schnell an seine Grenzen. 


ChatGPT mit DALL·E 3 punktet genau hier: Ich kann sagen, „Ersetze das rote T-Shirt durch ein blaues“ – und es passiert. Ich kann den Text ändern, den Hintergrund anpassen, ein Objekt entfernen, ohne dass das gesamte Bild neu interpretiert wird. Diese semantische Steuerbarkeit macht DALL·E in vielen UX-Kontexten nützlicher – insbesondere dann, wenn ich Illustrationen mit klarer Botschaft, erklärende Grafiken oder wiedererkennbare Bildreihen für Slides, Artikel oder Social Media brauche. 

 

Warum das für UX-Leute relevant ist 

Visuals sind in der UX-Kommunikation kein Beiwerk. Sie transportieren Haltung, Fokus, Struktur – und helfen, komplexe Inhalte zugänglich zu machen. Wenn ich heute mit ChatGPT ein Bild mit Text erzeuge, das sinnvoll aussieht und inhaltlich korrekt ist, spare ich mir oft den Umweg über Grafiktools, Stockfotos oder Bildmanipulationen. 


Außerdem erlaubt die Kombination aus Referenzbild und sprachgesteuerter Änderung eine sehr iterative Arbeitsweise. Ich kann experimentieren, anpassen, vergleichen – und dadurch visuelle Konzepte schnell entwickeln oder testen. Das ist besonders hilfreich in frühen Projektphasen, bei UX-Konzepten oder in der internen Kommunikation. 

 

Fazit: Bild-KI wird nützlicher – nicht nur schöner 

ChatGPT ist keine Designerin. Und DALL·E wird Dir keine vollständige Infografik mit Grid-System und sauberem Satzspiegel bauen. Aber: Die neuen Fähigkeiten, Text korrekt darzustellen, bestehende Bilder gezielt zu verändern und visuelle Ideen verständlich umzusetzen, machen das System endlich praktikabel – nicht nur inspirierend. 


Für UX-Menschen bedeutet das: Wer heute Ideen kommunizieren will, muss nicht mehr auf perfekt gerenderte Mockups warten. Ein gutes Prompt, ein Bild, ein paar gezielte Anpassungen – und plötzlich wird aus einer Idee etwas Sichtbares. Etwas, das verstanden wird. Etwas, das wirkt. 


Und genau darum geht’s doch in UX. 



💌 Noch nicht genug? Dann lies weiter – in unserem Newsletter.

Kommt viermal im Jahr. Bleibt länger im Kopf.  https://www.uintent.com/de/newsletter




Ein:e Schiedsrichter:in hält eine Bewertungstafel mit der Aufschrift „Yupp.ai“ zwischen zwei stilisierten KI-Chatbots in einem Boxring hoch – Symbolbild für den fairen Vergleich von KI-Modellen durch Nutzer:innen.

Wie Yupp Feedback nutzt, um KI-Modelle fair zu bewerten – und was UX-Profis daraus lernen können

AI & UXR, CHAT GPT, HUMAN VS AI, LLM

3D-Illustration eines digitalen Marktplatzes mit bunten Marktständen voller Prompt-Karten und einer Figur, die einen Prompt auswählt.

Prompts kaufen, teilen, verkaufen – was Prompt-Marktplätze heute leisten (und warum das für UX relevant ist)

AI & UXR, PROMPTS

Roboter hält zwei Schilder hoch: „ISO 9241 – 7 Prinzipien“ und „ISO 9241 – 10 Prinzipien“.

ChatGPT halluziniert – trotz Anti-Halluzinations-Prompt

AI & UXR, HUMAN VS AI, CHAT GPT

Erdbeere wird von einem Messer halbiert, stilisierte Illustration.

Warum KI manchmal nicht bis 3 zählen kann – und was das mit Tokens zu tun hat

AI & UXR, TOKEN, LLM

Quadratisches, in der Mitte geteiltes Motiv: Links ein graues, stilisiertes Gehirn über einer sitzenden Person am Laptop in dunklen Grautönen; rechts ein leuchtend blaues, vernetztes Gehirn über einer stehenden Person vor einem holografischen Interface auf dunklem Hintergrund.

GPT-5 ist da: Verändert diese UX AI wirklich alles für Researcher:innen?

AI & UXR, CHAT GPT

Surreales KI-Bild mit Datenströmen, durchgestrichenem „User Expirince“ und dem Text „ChatGPT kann jetzt Text in Bild“.

Wenn KI Bilder malt und plötzlich richtig schreiben kann

AI & UXR, CHAT GPT, HUMAN VS AI

Mensch und KI arbeiten gemeinsam an einem leuchtenden Baum auf dem Bildschirm, umgeben von dunkler, surrealer Atmosphäre.

Wenn der Text zu glatt ist: Wie man KI-Sprache menschlicher macht

AI & UXR, AI WRITING, CHAT GPT, HUMAN VS AI

Futuristische Illustration: Mensch blickt auf leuchtende, humanoide KI vor digitalem Hintergrund.

Kein Science Fiction – KI macht sich selbstständig

AI & UXR, CHAT GPT

Illustration einer KI, die mit einem Menschen kommuniziert, symbolisch für die Überzeugungskraft künstlicher Intelligenz.

Zwischen Argument und Einfluss – Wie überzeugend darf KI sein?

AI & UXR, CHAT GPT, LLM

Eine zweidimensionale Comic Frau steht vor einem menschengroßen Handy, auf dem Gesundheitsapps zu sehen sind. Rechts von ihr steht ein Kasten mit einem Computer drauf, auf dem ein EKG zu sehen ist.

Digital Health Apps & Interfaces: Warum gute UX entscheidet, ob Patienten wirklich profitieren

HEALTHCARE, MHEALTH, TRENDS, UX METHODS

Illustration einer roten Hand, die symbolisch „Censorship“ über „User Privacy“ bei DeepSeek priorisiert; im Hintergrund die chinesische Flagge.

Zensur trifft KI: Was DeepSeek über Menschenrechte verschweigt – und warum das UX betrifft

AI & UXR, LLM, OPEN AI

Illustration im isometrischen Flat Design zeigt eine vernetzte, internationale UX-Studienlogistik mit Paketen, Checkliste, Videokonferenzen und Positionsmarkierungen auf einer Weltkarte.

Die Voraussetzungen für den Erfolg: Globale Studie zur Logistik in der UX-Forschung für medizinische Geräte

HEALTHCARE, UX METHODS, UX LOGISTICS

Surreale, leuchtende Illustration eines KI-Sprachmodells als Gehirn, das von einer Hand beeinflusst wird – symbolisiert Manipulation durch externe Kräfte.

Propaganda Chatbots - Wenn die KI plötzlich russisch spricht

AI & UXR, LLM

Illustration mit sieben Tieren, die verschiedene Denk- und Prompt-Stile in der UX-Arbeit symbolisieren.

Willkommen im Prompt-Zoo

AI & UXR, PROMPTS, UX

Ein zwei dimensionales Bild von einem Mann, der an einem Schreibtisch mit geöffnetem Laptop sitzt, auf dem ein Gesundheitssymbol zu sehen ist. Im Hintergrund hängt ein Plakat mit einem DNA-Strang.

UX Regulatory Compliance: Warum Usability für Zulassung in MedTech entscheidend ist

HEALTHCARE, REGULATIONS

Illustration einer Glühbirne mit abstrakten Symbolen wie Fragezeichen, Wolke, Sprechblase und Kreuz – symbolisiert kreative Ideen und kritisches Denken.

Warum Prompts, die Bias und Halluzinationen produzieren, manchmal hilfreich sein können

AI & UXR, CHAT GPT, HUMAN VS AI, OPEN AI

Illustration eines Mannes am Laptop, umgeben von Symbolen für globale medizinische Forschung: Weltkarte mit Standortmarkierungen, Monitor mit Kreuzsymbol, Patientenakte und Stethoskop.

Global UX Research in Medical Technology: Internationale Nutzerforschung als Erfolgsfaktor

HEALTHCARE, MHEALTH, REGULATIONS

Abstrakte, pastellfarbene Illustration mit einer stilisierten Gehirnform und geometrischen Formen – Sinnbild für KI und Verzerrungen.

KI, Bias und die Macht der Frage: Wie Du mit klugen Prompts bessere Antworten bekommst

AI & UXR, CHAT GPT

Eine Frau in einem Zahnrad ist umgeben von Symbolen für globale Vernetzung, Zusammenarbeit, Innovation und Nutzerzentrierung – verbunden durch Pfeile. Sanfte, helle Farben aus einer modernen UI-Farbpalette.

UX automatisieren? Ja bitte! Warum Zapier und n8n für UX-Teams echte Supertools sind

CHAT GPT, TOOLS, AUTOMATION, AI & UXR

Ein 2D Bild von einem Mann in weißem Kittel, der auf einen Bildschirm zeigt, auf dem ein OP-Roboterarm zu sehen ist.

Surgical Robotics und UX: Warum Benutzerfreundlichkeit den OP-Erfolg mitbestimmt

HEALTHCARE, TRENDS, UX METHODS

 VERWANDTE ARTIKEL DIE SIE INTERESSIEREN KÖNNTEN 

AUTHOR

Tara Bosenick

Tara ist seit 1999 als UX-Spezialistin tätig und hat die Branche in Deutschland auf Agenturseite mit aufgebaut und geprägt. Sie ist spezialisiert auf die Entwicklung neuer UX-Methoden, die Quantifizierung von UX und die Einführung von UX in Unternehmen.


Gleichzeitig war sie immer daran interessiert, in ihren Unternehmen eine möglichst „coole“ Unternehmenskultur zu entwickeln, in der Spaß, Leistung, Teamgeist und Kundenerfolg miteinander verknüpft sind. Seit mehreren Jahren unterstützt sie daher Führungskräfte und Unternehmen auf dem Weg zu mehr New Work / Agilität und einem besseren Mitarbeitererlebnis.


Sie ist eine der führenden Stimmen in der UX-, CX- und Employee Experience-Branche.

bottom of page