Inhaltsverzeichnis
KI soll einfach sein. Also füttern wir gleich acht KI-Bildgeneratoren im Test mit der identischen Beschreibung und schauen, was geliefert wird. Ganz ohne komplizierte Anpassung der Befehle oder sonstige Optimierungen. Kann das was werden? Welches Programm liefert am besten ab?
KI-Bildgeneratoren im Test
Wie sag ich es der KI? Dieses Thema wird gern diskutiert und von allen Seiten werden Tipps und Tricks für die besten „Prompts“, also die Befehle, angeboten.
Wir haben uns aber gesagt: Was können die Bildgeneratoren aus dem Stand heraus, ohne komplexe Befehle, sondern einfach mit einer detaillierten Bildbeschreibung? Ohne Nachkorrektur? Mit zwei ganz unterschiedlichen Motivideen haben wir acht aktuelle und bekannte KI-Generatoren „gefüttert“. Die Beschreibung haben wir absichtlich sehr allgemein gehalten.
Bei den Ergebnissen waren wir selbst überrascht: Mit dem Naturmotiv hatten einige KI-Porgramme echte Schwierigkeiten, allen voran Firefly und OpenArt.AI.
Bei unserem „Science-Fiction“-Bild gleichen sich die erzeugten Szenen bei allen Anbietern enorm, der Stil ist fast durchgehend identisch. Einzig Open AI ChatGPT und erneut OpenArt.AI liefern hier angestaubten Computerspiel-Look statt Realismus ab.
Meistens „fast gut“
Im direkten Vergleich* wird klar: Es ist erstaunlich, was die Bildgeneratoren schon leisten. Aber ebenfalls klar ist: Mit nur einem Befehl, ohne Nachkorrekturen, sind die Ergebnisse nur „fast gut“. Gerne vergessen die KIs Informationen, bei Firefly wurde die Libelle viel zu klein platziert, Midjourney hat sie komplett rausgelassen, obwohl es als Hauptmotiv gewünscht war.
Auch mit der tropischen Bildstimmung hatten die KIs echte Probleme, denn Tannen gehören da wirklich nicht hin. Insgesamt: Die KI-Systeme verbessern sich rasend schnell, trotzdem muss man aktuell noch immer experimentieren und ausprobieren, um das perfekte Motiv zu bekommen.
Im Vordergrund ein natürlicher Teich mit Wasserpflanzen, eine Libelle sitzt groß im Fokus im Vordergrund auf einem Schilfgras. Im Teich stehen mehrere Flamingos. Hinter dem Teich: Wald, Wiese und Berge. Insgesamt sommerliche Stimmung und tropisch.
- Erste Bildbeschreibung (Prompt)
Surreale, moderne Stadtkulisse aus der Vogelperspektive. Weiße, glänzende Luftschiffe als Transportmittel. Bäume auf den Dächern. Nachtstimmung.
- Zweite Bildbeschreibung (Prompt)
*Anmerkung: Unser Test ist natürlich nur eine Momentaufnahme, da jedes Motiv ja in der aktuellen Sekunde generiert wird und schon beim nächsten Mal komplett anders aussehen kann. Aber wir konnten doch klare Tendenzen feststellen, wo die Stärken und Schwächen der einzelnen Services liegen.
Adobe Firefly
- Anbieter: Adobe
- Website: firefly.adobe.com
- Systemanforderung: webbasiert
- Preis (UVP): 5,50 €/Monat oder Cloud-Abo
Pro und Kontra
+ einfache Bedienung
+ viele verschiedene Einstellungen
+ schnelle Verarbeitung
- ignoriert Teile der Beschreibung
- Auflösung der Bilder
- Umsetzung von Naturbildern
Die Web-Oberfläche von Adobe Firefly wirkt fast wie eine „echte“ Software. Die Bedienung macht Spaß und es ist praktisch, dass man Stil, Bildformat oder auch Perspektiven einfach im Menü anwählt und nicht in der Bildbeschreibung unterbringen muss. Bei den Bildergebnissen waren wir mit unseren zwei Tests nicht so ganz zufrieden.
Firefly ignorierte immer wieder einige Teile der Beschreibung. Des Weiteren ist die Bildauflösung beim Download zwar in Ordnung, die Qualität selbst lässt bei fotorealistischen Bildern zu wünschen übrig und ist sehr grob.
Spannend: Firefly ist bei surrealen, futuristischen Motiven extrem gut und überrascht mit originellen Resultaten. Natur & Co. liegen dieser KI jedoch nicht, das kann die Konkurrenz besser.
Open AI ChatGPT
- Anbieter: OpenAI
- Website: www.chatgpt.com
- Systemanforderung: webbasiert
- Preis (UVP): 19 €/Monat (inkl. ChatGPT)
Pro und Kontra
+ einfache Bedienung per Eingabe
+ extrem fotorealistisch
+ schnelle Verarbeitung
+ einfacher Korrektureditor
- komplexe Korrekturen nur per Eingabe
- immer nur ein Bildvorschlag pro Generierung
Der bekannte Bildgenerator DALL-E von ChatGPT wurde fest in ChatGPT integriert und ist nicht mehr separat verfügbar. Die Bedienung erfolgt zunächst nur per Texteingabe. Selbst Begriffe wie „fotorealistisch“ muss man einfügen, um den passenden Stil zu erhalten.
Für Nachkorrekturen kann man im Bild direkt Markierungen und Erläuterungen platzieren, um verbesserte Motive zu erhalten. Im Test kann das Naturbild überzeugen, auch wenn die tropische Stimmung nicht umgesetzt wurde. Unsere surreale Stadtkulisse wirkt aber wie aus einem alten Computerspiel.
Die Auflösung liegt bei einem 16:9-Bild bei circa 1700 × 1000 Pixel, sofern man die kostenpflichtige Version nutzt. Die Bildqualität ist super und damit schlägt ChatGPT die Konkurrenz.
Ideogram
- Anbieter: Ideogram
- Website: www.ideogram.ai
- Systemanforderung: webbasiert
- Preis (UVP): gratis | ab 6 €/Monat
Pro und Kontra
+ simple Bedienung
+ vier Bildvorschläge pro Generierung
+ Detailauflösung der Bilder
- Bildveröffentlichung im Gratis-Modus
- Warteschlange im Gratis-Modus
- Benutzeroberfläche nur auf Englisch
Trotz englischer Benutzerführung können Sie die Bildbeschreibung bei Ideogram einfach auf Deutsch eingeben, die Web-App übersetzt automatisch. Die Bedienelemente sind selbsterklärend und grobe Voreinstellungen fix erledigt. Bei der Gratisversion ist dann Geduld angesagt, hier gibt es vor jedem Bildvorschlag eine halbe Minute Zwangspause.
Außerdem sollten Sie wissen, dass in der kostenlosen Version die von Ihnen generierten Bilder öffentlich zur Verfügung stehen und bei Ideogram unter Umständen angezeigt werden.
Bei der Bildgenerierung waren die Naturbilder in Kontrast und Farbe eher flau, technisch-futuristisch war das Ergebnis deutlich brillanter. Schade, dass die Bildauflösung nur in der Bezahlversion mit 2K verfügbar ist.
Cyberlink MyEdit
- Anbieter: Cyberlink
- Website: www.myedit.online
- Systemanforderung: webbasiert
- Preis (UVP): Credit-Pack ab 9 €
Pro und Kontra
+ einfache Benutzerführung
+ viele Stile zur Vorauswahl
+ Credit-System ohne Abo
- ignoriert Teile der Beschreibung
- fotorealistische Motive zu künstlich
- geringe Auflösung
Cyberlink bietet mit dem MyEdit-Service nicht nur Bildgenerierung, sondern viele weitere Services und sogar Audiobearbeitung an. Fokussiert auf die Erstellung neuer Bilder, versteht die gut strukturierte Web-App deutsche Sprachbefehle und dank der Einstellungen spart man sich die manuelle Beschreibung von Bildstil oder Formatwunsch.
Die Umsetzung erfolgt schnell. Im Test hat MyEdit beim Naturbild aber unsere Flamingos vergessen und die Umsetzung der Luftschiffe ist grafisch und von der Idee her gesehen eher auch mau.
Die Bildqualität selbst ist sehr gut, leider ist auch in der Bezahlversion die Auflösung gering, bei 16:9 ist 1280 × 720 Pixel das Maximum. Sehr gut gefällt, dass Cyberlink kein Abo hat, sondern auf Credit-Packs setzt.
Pikaso Freepik
- Anbieter: Freepik Company S. L.
- Website: www.freepik.com
- Systemanforderung: webbasiert
- Preis (UVP): gratis | 10 €/Monat
Pro und Kontra
+ hervorragende Bedienung
+ sehr gute Gratisfunktionen
+ schnelle Verarbeitung
- Benutzeroberfläche nur auf Englisch
- Fotoergebnisse zu künstlich
- funktioniert nur mit englischen Prompts korrekt
Hat man sich bei Pikaso erstmal zum KI-Bereich vorgearbeitet, dann präsentiert sich das Tool von der benutzerfreundlichen Seite – nach dem Eintippen der Bildbeschreibung klicken Sie sich Schritt für Schritt durch weitere Einstellungen, erst dann werden Bildvorschläge generiert.
Im Test hat Freepik alles gut verstanden und die Szenen sehr gut umgesetzt. Voraussetzung ist aber, dass die Beschreibung in englischer Sprache erfolgt. Zwar übersetzt die App deutsche Eingaben, versteht diese aber nur fehlerhaft und liefert merkwürdige Resultate.
Das ist leider ein großer Minuspunkt. Die Bildqualität selbst ist scharf und sehr gut aufgelöst, im Vergleich wirken die fotorealistischen Motive unserer Meinung nach einen Tick zu künstlich.
OpenArt
- Anbieter: OpenArt
- Website: www.openart.ai
- Systemanforderung: webbasiert
- Preis (UVP): gratis | ab 7 €/Monat
Pro und Kontra
+ sehr schnell
+ einfache Bedienung
- keine fotorealistischen Ergebnisse
- Ergebnisse fehlerhaft
- ignoriert Teile der Beschreibung
- funktioniert nur mit englischen Prompts einigermaßen korrekt
In Sachen Marketing ist OpenArt ganz vorn dabei und schmuggelt sich bei Google immer nach vorn. Leider gilt das nicht für die KI, die in der Web-App steckt. Egal, ob Bildbeschreibungen auf Englisch oder Deutsch verwendet werden, die Ergebnisse waren die schlechtesten in unserem Vergleich und keinesfalls fotorealistisch.
Die Szenen passten nicht, die Umsetzung war fehlerhaft und man hatte den Eindruck, dass die KI viel zu frei interpretiert. Es gelang uns nicht, auch mit mehreren Anläufen, beim Bild mit den Flamingos auch nur annähernd eine passende Version zu erzeugen.
Bei der surrealen Stadtkulisse lieferte OpenArt zwar passendere Resultate, die aber im Vergleich zur Konkurrenz einfach nicht mithalten können.
Leonardo.AI
- Anbieter: Leonardo Interactive Pty Ltd
- Website: www.leonardo.ai
- Systemanforderung: webbasiert
- Preis (UVP): gratis | ab 9 €/Monat
Pro und Kontra
+ sehr gute Bedienung
+ hervorragende Bildideen
+ umfangreicher Gratis-Modus
+ gute Bildauflösung
- Benutzeroberfläche nur auf Englisch
- funktioniert nur mit englischen Prompts korrekt
Wie viele unserer Testkandidaten ist Leonardo.AI nur in englischer Sprache verfügbar. Deutsche Bildbeschreibungen sind möglich, aber werden falsch verstanden.
Es lohnt sich, diese vorher zu übersetzen. Geht es dann ans Bilder generieren, bietet die App viele gute Voreinstellungen und die Bildergebnisse waren in unserem Testlauf durchweg sehr gut und sehr schnell erstellt. Die Auflösung bei 16:9 im kostenlosen Modus ist mit rund 1400 × 800 Pixeln ausreichend.
Ganz fotorealistische Resultate und das Recht, dass Ihre Ergebnisse nicht weiterverwendet werden gibts dann allerdings nur im Monatsabo. Wo die KI-Reise hingeht zeigt Leonardo mit der Möglichkeit, aus dem Wunschbild direkt ein Video zu erstellen, und das ist schon beeindruckend.
Midjourney
- Anbieter: Midjourney Inc.
- Website: www.midjourney.com
- Systemanforderung: webbasiert
- Preis (UVP): gratis | ab 9 €/Monat
Pro und Kontra
+ superschnell
+ Sicherung der Motive im Feed
+ Fotorealismus
+ Multitasking der Web-App
- kein Gratistest möglich
- Benutzeroberfläche
Midjourney war ein Pionier bei der KI-Bilderstellung und wird von Profis geschätzt. Tatsächlich sind die Bildergebnisse in Sachen Fotorealismus wirklich Oberklasse. Allerdings schnitt diese KI in unserem Test tatsächlich nicht ganz so gut ab.
Beim Naturbild wurde das gewünschte Hauptmotiv, die Libelle, komplett ignoriert und beim Technik-Bild waren die meisten Luftschiffe nicht wie gewünscht weiß. Sprich: In Midjourney muss man sich etwas reinarbeiten und mit den Befehlen spielen, um dann wirklich grandiose Ergebnisse zu erhalten.
Freude macht der Bilder-Feed, der sämtliche Varianten inklusive der verwendeten Befehle abspeichert. Schade, dass es keine Gratisversion zum Ausprobieren gibt, sondern auf alle Fälle ein Monatsabo fällig wird.