„Generative Künstliche Intelligenz kann Ihren Büroalltag nachhaltig verändern. Unternehmen, die diese Technologie nutzen, können ihre Effizienz und Innovationskraft erheblich steigern und sich damit langfristig einen Wettbewerbsvorteil erarbeiten.“, so ChatGPT (Version GPT-4, OpenAI, 2024). Diese und ähnlich lautende Versprechen werden spätestens seit Einführung von ChatGPT 3.5 im November 2022 vielfach in der breiten Öffentlichkeit wiederholt. Kritische Stimmen weisen dabei auf Datenschutz-, Nachhaltigkeits- und ethische Belange hin, die bei deren Verwendung zwingend zu berücksichtigen sind.
Ziel dieser Blogreihe ist, nützliche Werkzeuge abseits der ausgetretenen Pfade der Texterzeugung vorzustellen, die Büroabläufe und die tägliche Arbeit kleiner und mittlerer Unternehmen tatsächlich vereinfachen. Bei richtiger Anwendung kann generative KI Mitarbeitende von Routineaufgaben entlasten und somit mehr Ressourcen für Aufgaben mit erforderlicher menschlicher Intelligenz schaffen.
Bildgenerierung
Auf generativen KI-Modellen basierende Bildgeneratoren haben in den letzten Jahren eine beachtliche Entwicklung erfahren und sind in kürzester Zeit zu einem wertvollen Werkzeug in verschiedenen Branchen geworden. Diese Technologien nutzen maschinelles Lernen, um aus textlichen Beschreibungen, sogenannten Prompts, beeindruckende visuelle Inhalte zu erzeugen. Die Einsatzmöglichkeiten sind dabei so vielfältig wie faszinierend.
Statt stundenlanger Vorarbeiten zu leisten, können Künstler und Designer nun mit wenigen Stichworten Ideen visualisieren und Konzepte schneller als je zuvor entwickeln. Dies hat nicht nur den Designprozess beschleunigt, sondern auch den Zugang zur visuellen Kommunikation erleichtert. Der Einsatz dieser Tools befähigt auch Personen ohne formale künstlerische Ausbildung kreative Konzepte zu erarbeiten.
Im Marketing und in der Werbung bieten diese Generatoren eine neue Dimension der Individualisierung. Unternehmen können maßgeschneiderte Visuals in Echtzeit erstellen, um gezielte Kampagnen zu entwickeln, die spezifisch auf bestimmte Zielgruppen abgestimmt sind. Diese Flexibilität erhöht die Relevanz von Inhalten und damit die Wirksamkeit von Marketingmaßnahmen erheblich.
Auch im Bildungssektor zeigt sich das Potenzial von Bildgeneratoren. Lehrende können abstrakte Konzepte durch ansprechende und leicht verständliche Grafiken veranschaulichen, was das Lernen fördert und den Unterricht bereichert. Zudem können Lernende mit diesen Tools eigene kreative Projekte entwickeln und präsentieren, was ihre digitale Kompetenz stärkt.
In der Architektur und Stadtplanung ermöglichen Bildgeneratoren die schnelle Visualisierung von Entwürfen und Ideen, was die Kommunikation zwischen Architekten, Kunden und Bauherren verbessert. Auch in der Medizin könnten solche Tools in Zukunft genutzt werden, um komplexe Diagnosen oder Operationsabläufe visuell darzustellen und so das Verständnis für medizinische Sachverhalte zu erleichtern.
Trotz dieser vielversprechenden Anwendungen gibt es auch Herausforderungen. Die ethischen Implikationen, wie beispielsweise die Urheberschaft von KI-generierten Werken oder das Potenzial für den Missbrauch zur Erstellung manipulativer oder schädlicher Inhalte, müssen sorgfältig abgewogen werden. Der verantwortungsvolle Einsatz von Bildgeneratoren erfordert daher nicht nur technisches Wissen, sondern auch ein tiefes Verständnis für die sozialen und ethischen Konsequenzen dieser Technologien. Das Mittelstand-Digital Zentrum Ilmenau unterstützt Sie gern bei allen Themen rund um generative KI.
Bildgeneratoren haben das Potenzial, die Art und Weise, wie wir Bilder erzeugen und nutzen, grundlegend zu verändern. Die Zukunft dieser Technologien wird maßgeblich davon abhängen, wie wir ihre Chancen und Risiken in Einklang bringen.
Nachdem wir die vielfältigen Einsatzmöglichkeiten von Bildgeneratoren betrachtet haben, stellt sich die Frage, welche konkreten Tools aktuell zur Verfügung stehen und welche Unterschiede es zwischen kostenfreien und kostenpflichtigen Angeboten gibt. Webbasierte Plattformen wie Midjourney und Leonardo.ai bieten leistungsstarke Bildgenerierungsfunktionen, die jedoch in ihren Zugangsmodellen, Funktionen und Lizenzbedingungen variieren. Bei der Auswahl eines solchen Tools sollten Nutzer daher nicht nur auf die Qualität der generierten Bilder achten, sondern auch die Kostenstruktur, die Nutzungsrechte und die Datenschutzrichtlinien genau prüfen. Insbesondere der Serverstandort der jeweiligen Plattform ist zu berücksichtigen, da dies in Deutschland Einfluss auf die Datensicherheit und die Einhaltung der DSGVO-Vorgaben haben kann. Allen gemein ist, dass lokale Installationen nicht notwendig sind. Sie sind einfach per URL im Browser verfügbar, adressieren jedoch unterschiedliche Zielgruppen mit z.T. stark variierender Qualität der Bilder. Zu beachten ist jedoch auch, dass die erzeugten Bilder gerade bei kostenfreien Lizenzen oft für alle Nutzer der Plattform einsehbar sind.
Vom guten Prompt zum besseren Ergebnis
Beim Einsatz von Bildgeneratoren ist das sogenannte „Prompting“ entscheidend für die Qualität der Ergebnisse. Ein Prompt ist die textliche Eingabe, die den Generator anweist, welche Art von Bild erstellt werden soll. Die Präzision und die Kreativität des Prompts bestimmen maßgeblich das Resultat. Um hochwertige und spezifische Bilder zu erhalten, sollten Nutzer klare, detaillierte Beschreibungen verwenden und mit verschiedenen Schlüsselwörtern experimentieren, die Stil, Farbe, Komposition oder bestimmte Elemente beschreiben.
Die Qualität der Ergebnisse lässt sich durch gezielte Anpassungen und Iterationen verbessern. Beispielsweise kann das Hinzufügen von spezifischen Adjektiven oder Referenzen zu Kunststilen den Stil des Bildes stark beeinflussen. Zudem bieten Plattformen wie Lexica.art eine nützliche Ressource, um Inspirationen zu finden und erfolgreiche Prompts zu analysieren. Diese Datenbank enthält eine Vielzahl an Beispielen von Prompts und den dazugehörigen generierten Bildern, was besonders hilfreich ist, um eigene Prompts zu verfeinern und die gewünschte Bildästhetik zu erzielen.
Neben der Auswahl und Formulierung des Prompts ist auch die wiederholte Generierung und Anpassung der Bilder wichtig. Viele Tools bieten die Möglichkeit, mehrere Versionen eines Bildes zu erstellen, sodass man durch Auswahl und Modifikation der besten Ergebnisse schrittweise zur idealen Darstellung gelangt. Geduld und Experimentierfreude sind daher entscheidend, um das volle Potenzial der Bildgeneratoren auszuschöpfen.
Um einen effektiven Prompt zur Bildgenerierung zu erstellen, sollten Sie folgende Aspekte berücksichtigen:
- Englisch: Die besten Ergebnisse werden mit englischen Eingaben erzielt, auch wenn viele Generatoren Deutsch verstehen.
- Klarheit und Präzision: Verwenden Sie eindeutige und spezifische Begriffe, um das gewünschte Bild genau zu beschreiben. Allgemeine oder vage Begriffe führen oft zu unscharfen Ergebnissen.
- Detailgrad: Geben Sie Details zu wichtigen Elementen an, wie Farben, Stile, Lichtverhältnisse oder Texturen. Zum Beispiel: „pastellfarbenes Licht“ oder „realistische Textur“.
- Stilrichtungen und Referenzen: Verweisen Sie auf bestimmte Kunststile, Epochen oder bekannte Werke, um den gewünschten Look zu erzielen. Zum Beispiel: „impressionistischer Malstil“ oder „in der Art von Jugendstil“.
- Komposition und Perspektive: Beschreiben Sie die Anordnung der Elemente und die Perspektive. Zum Beispiel: „Vogelperspektive auf eine Stadt“ oder „Porträt in der Nahaufnahme“.
- Stimmung und Atmosphäre: Bestimmen Sie die emotionale Wirkung des Bildes, etwa „mystische Atmosphäre“ oder „fröhliche, lebendige Farben“.
- Zeichensetzung und Reihenfolge: Die Reihenfolge, in welcher Sie Ihrem Bild Attribute zuweisen, kann das Ergebnis beeinflussen. Als Faustregel gilt: Je weiter vorn eine Eigenschaft steht, desto dominanter ist sie später in der Ausgabe. Trennen Sie Attribute mit einem Komma voneinander, damit die KI sie besser interpretieren kann.
- Iterative Anpassung: Verfeinern Sie den Prompt basierend auf den Ergebnissen, indem Sie zusätzliche Details hinzufügen oder bestimmte Aspekte hervorheben.
Ein guter Prompt für ein Unternehmen im IKT-Bereich, dass auf einem Plakat Fachkräfte anwerben möchte, könnte also wie folgt lauten:
“Modern poster design for an IT company recruiting professionals: Bright, dynamic colors with clean, futuristic lines. At the center, a stylized laptop with an abstract code background. The headline ‚Join Our Tech Revolution‘ in bold, modern font. In the background, a subtle silhouette of a tech city skyline symbolizing innovation and progress. The image should convey a professional yet welcoming atmosphere, highlighting technical excellence and career opportunities.”
„Modernes Plakatdesign für ein IT-Unternehmen, das Fachkräfte rekrutiert: Helle, dynamische Farben mit klaren, futuristischen Linien. In der Mitte ein stilisierter Laptop mit einem abstrakten Codehintergrund. Die Schlagzeile ‚Join Our Tech Revolution‘ in fetter, moderner Schrift. Im Hintergrund eine subtile Silhouette der Skyline einer Technologiestadt, die Innovation und Fortschritt symbolisiert. Das Bild soll eine professionelle und doch einladende Atmosphäre vermitteln und technische Spitzenleistungen und Karrieremöglichkeiten hervorheben.“
Damit wurden nachfolgend zwei Bilder mit unterschiedlichen Bildgeneratoren erzeugt.
Quelle: DALL-EBildquelle: DALL-E 2024 |
Quelle: Leonardo.aiBildquelle: Leonardo.AI 2024
|
Grenzen heutiger Bildgeneratoren
Trotz der beeindruckenden Fähigkeiten von modernen Bildgeneratoren gibt es immer noch einige wesentliche Herausforderungen. Ein großes Problem besteht darin, dass die Modelle die Bildinhalte nicht wirklich „verstehen“. Das bedeutet, dass es schwierig ist, einzelne Elemente eines Bildes zu ändern, während der Rest des Bildes unverändert bleibt. Eine präzise Bearbeitung oder Austausch spezifischer Details ist oft nur begrenzt möglich und erfordert viel Iteration. Ein weiteres häufiges Problem ist die Darstellung von menschlichen Händen und Fingern, die oft fehlerhaft oder verzerrt wiedergegeben werden. Auch bei komplexen Szenen mit mehreren Personen oder Objekten können die Modelle Schwierigkeiten haben, eine korrekte Perspektive und räumliche Anordnung zu erzeugen, was zu unrealistischen oder unnatürlichen Ergebnissen führt. Diese Einschränkungen zeigen, dass Bildgeneratoren zwar leistungsstark sind, aber noch nicht die Genauigkeit und Flexibilität menschlicher Kreativität erreichen, wie die nachfolgenden Beispiele zeigen.
Quelle: Leonardo.ai | Quelle: Leonardo.ai | Quelle: Leonardo.ai |
Fazit
Die Nutzung moderner Bildgeneratoren bietet immense kreative Möglichkeiten, von der Kunst über Marketing bis hin zur Bildung. Entscheidend für den Erfolg ist dabei die Kunst des „Promptings“ – die Fähigkeit, klare, detaillierte und stilistisch präzise Anweisungen zu formulieren. Durch iterative Anpassungen und die Nutzung von Ressourcen wie Lexica.art können Nutzer die Qualität ihrer generierten Bilder stetig verbessern. Bildgeneratoren haben das Potenzial, den kreativen Prozess zu revolutionieren, erfordern aber ein gutes Verständnis für Sprache und Bildkomposition, um ihr volles Potenzial auszuschöpfen.
Beispiele: Leonardo.ai // MidJourney // Stable Diffusion // Adobe Firefly
Gute Übersichten über aktuelle Online-Bildgeneratoren mit Vor- und Nachteilen finden Sie zusammengefasst zum Beispiel auf folgenden Seiten:
- https://www.gradually.ai/ki-bildgeneratoren/
- https://www.mediamarkt.de/de/content/it-informatik/software-apps/ki-bilder-erstellen-bildgeneratoren
Benötigen Sie Unterstützung bei der Suche der passenden Anwendung, um Ihr Büromanagement effizienter zu gestalten, wenden Sie sich gern an unseren KI-Trainer Karsten Jahn.
Ansprechpartner:
Karsten Jahn
KI-Trainer Modellfabrik Virtualisierung
Telefon: 03641 / 205-295E
E-Mail: jahn@kompetenzzentrum-ilmenau.de
Bildquellen
- Plakat zum Vergleich DALL-E: DALL-E
- Leonardo_Phoenix_Modern_poster_design_for_an_IT_company_recrui_3: Leonardo.ai
- Default_little_spock_from_vulcan_with_typical_hand_sign_V_0: Leonardo.ai
- Default_little_spock_from_vulcan_with_typical_hand_sign_V_2: Leonardo.ai
- Default_create_a_photo_realistic_image_of_a_wind_turbine_3: Leonardo.ai
- AI Generatoren: Leonardo.ai