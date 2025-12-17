News & Trends 11 3

GPT-Image 1.5: mehr Tempo und Kontrolle bei KI-Bildern

Mit GPT-Image 1.5 baut OpenAI die Bildfunktionen von ChatGPT aus. Eine neue Images-Ansicht bündelt Erzeugung und Bearbeitung visueller Inhalte und soll präziser sowie schneller arbeiten als bisherige Lösungen.

OpenAI hat mit GPT-Image 1.5 ein neues Modell für die Bildgenerierung vorgestellt, das direkt in ChatGPT integriert ist. Die neue Images-Ansicht in ChatGPT ermöglicht es Nutzern und Nutzerinnen, Bilder zu erzeugen, hochgeladene Fotos zu bearbeiten und visuelle Inhalte gezielt weiterzuentwickeln. Und das innerhalb einer zentralen Oberfläche.

Die neue Images-Ansicht ist direkt in die ChatGPT-Navigation integriert und als eigener Bereich gekennzeichnet.

Schneller und präziser: Das neue Modell

Laut OpenAI ist das neue Modell deutlich schneller als der Vorgänger und setzt Anweisungen präziser um. Das Tech-Unternehmen spricht von bis zu vierfach höherer Geschwindigkeit und einer verbesserten Instruktionsverarbeitung, die gezielte Änderungen an Bildern erleichtert und unbeabsichtigte Stilbrüche reduziert.

ChatGPT Images setzt neue Bildelemente kontextgerecht in bestehende Szenen ein und passt Perspektive sowie Beleuchtung an. Allerdings sieht mein Arm doch etwas merkwürdig aus.

Eigene Images-Ansicht für visuelle Arbeit

Die neue Images-Ansicht in ChatGPT rückt die Bildgenerierung und -bearbeitung in den Mittelpunkt. Nutzende können Bildideen direkt umsetzen, Varianten vergleichen und frühere Ergebnisse erneut bearbeiten. Der Chat bleibt weiterhin Teil des Workflows, sodass Konzepte und Texte weiterhin im Dialog entwickelt werden können.

Die gezielte Korrektur spiegelverkehrten Texts funktioniert, bleibt im Detail durch meinen vereinfachten Prompt aber nicht immer fehlerfrei.

Neben der klassischen Text-zu-Bild-Erzeugung legt OpenAI nun stärker den Fokus auf die Bearbeitung bestehender Bilder. Hochgeladene Fotos lassen sich gezielt verändern, einzelne Bereiche maskieren, ersetzen oder ergänzen. Die Steuerung erfolgt dabei ausschließlich über Textbefehle. Laut OpenAI ist die Funktion nicht als Ersatz für professionelle Bildbearbeitungssoftware gedacht, sondern als Lösung für schnelle Entwürfe, Illustrationen und redaktionelle Anpassungen.

Einordnung im KI-Bildgenerator-Markt

Im Vergleich zu spezialisierten Bildgeneratoren wie Midjourney oder Stable Diffusion verfolgt OpenAI einen anderen Ansatz: Die Bildgenerierung ist in eine universelle KI-Plattform integriert und setzt auf Zugänglichkeit und Kontextintegration. Während Midjourney bei ästhetisch anspruchsvollen Einzelbildern oft führend ist und Stable Diffusion technische Flexibilität bietet, rückt ChatGPT Images die Effizienz im Workflow und die einfache Bedienung in den Vordergrund. Der entscheidende Unterschied liegt weniger in der reinen Bildqualität als in der Integration von Text, Bild und Bearbeitung in einem System.

GPT-Image 1.5 verändert Kleidung und Stil gezielt, während Pose, Gesichtsausdruck und Lichtstimmung erhalten bleiben.

Google verfolgt mit Gemini Imagen 4 und Nano Banana Pro einen anderen Schwerpunkt. Die neuen Werkzeuge betonen vor allem hohe Bildqualität, verbesserte Textintegration und die direkte Einbindung in Google-Workspace-Anwendungen. Nano Banana Pro adressiert zudem stärker strukturierte Inhalte wie Infografiken oder datenbasierte Visualisierungen.

Während Google seine Bildgeneratoren klar in produktive Arbeitsumgebungen einbettet, positioniert OpenAI ChatGPT Images als niedrigschwelliges, vielseitiges Werkzeug. Der Unterschied liegt weniger in der reinen Bildqualität als in der jeweiligen Ausrichtung: hier Integration in bestehende Büro-Workflows, dort ein universeller KI-Arbeitsraum.

