Blog

Ein Roboter hält eine grüne Paprika
Foto: © DALL·E (vermutlich)

Blog

Künst­liche Intelli­genz in Grafik- und Web­design

Um künstliche Intelligenz (kurz »KI«) kommt man kaum herum: Die Entwicklung wächst, die Idee ist inzwischen auch schon über die Forschungs­umgebung hinausgewachsen und kommt im Alltag an. Mensch­liches Verhalten kann maschinell immer besser nachgeahmt werden und dadurch teilweise sogar ersetzt werden. Eine Oxford-Studie mit der Fragestellung »The Future of Employment: How susceptible are jobs to computerisation?« im Titel kam im Jahr 2013 zu dem Ergebnis, dass fast die Hälfte aller Arbeitsplätze auf dem US-Arbeitsmarkt durch die Konkurrenz von Roboter und Computer bedroht sind. Die Studie »The computerisation of European jobs« der London School of Economics kam zu ähnlichen Feststellungen. Der Beruf des Grafikdesigners ist laut der US-Studie nur gering bedroht, aber trotzdem ist die Zeit gekommen, um auf gegen­wärtige und zukünftige Veränderungen in meiner Branche zu schauen:

Bildbearbeitung mit Künstlicher Intelligenz

Vor allem beim »Freistellen«, also dem Entfernen von Hintergründen, gab es große Sprünge, die mir halfen, menschliche Fleiß­arbeit auf ein Minimum reduzieren. Zwar kommt Photoshop beispiels­weise schon seit Dekaden mit dem sogenannten »Zauberstab«, aber die Magie beschränkt sich auf das auto­matische Auswählen farblich-ähnlicher Flächen. Wirklich intelligent ist diese Funktion also nicht. Insbesondere bei Porträts von Menschen mit offenen Frisuren kann man sich diese Funktion deshalb praktisch schenken – erst recht vor unruhigen Hintergründen. Es blieb keine andere Option, als die Haare pixelgenau mit der Hand auszuschneiden. Je nach Komplexität des Motivs konnte das Stunden oder gar Tage dauern, in vielen Fällen stand das mögliche Ergebnis schon von vornherein nicht in einem Verhältnis zu der zu leistenden Arbeit. Deshalb war es unter dem Strich oft nicht machbar, den Hintergrund zu entfernen. Andere Agenturen haben das Problem mitunter auch damit gelöst, die undankbare Arbeit des Freistellens Auszubildenden oder Praktikant*innen zu überlassen. Mitunter wurde die Arbeit mittels Outsourcing sogar noch billigeren Arbeitskräften in Indien überlassen.

Die »Sensei« genannte KI von Adobe verhalf Photoshop seit dem Einführen der Creative Cloud zum Durchbruch: Mit dem Objekt­auswahl­werkzeug ist der Hintergrund in wenigen Augenblicken mit wenigen Klicks entfernt. Viele Optionen gibt es nicht, aber die braucht es auch nicht. Menschen und Objekte werden zuverlässig freigestellt, Haare oder unruhige Hintergründe sind kein Problem. Die mensch­liche Arbeit beschränkt sich dann vielleicht noch auf das Anpassen der Belichtung und der Farben, der Rest geschieht auto­matisch:

Eine Gegenüberstellung eines Porträts vor dem Meer im Original (links) und ohne Hintergrund (rechts)

Doch dabei bleibt es nicht: Mit den soge­nannten »Neural Filters« lassen sich mit Photoshop sogar Gesichts­ausdrücke anpassen. Aus einem Grinsen wurde ein Lachen (links), aber auch Wut oder Über­raschung kennt Photoshop. Je nach Motiv kann sogar der Kopf gedreht werden. Die Software »Luminar AI« halte ich für etwas einstiegs­freund­licher: Hier kann der Himmel in wenigen Schritten ausge­tauscht werden oder eine Tiefen­schärfe nachträglich hinzugefügt werden (rechts):

Die Berechnungen finden je nach Filter und Software auf dem Endgerät, aber manchmal auch in entfernten Rechen­zentren in der Cloud statt. Neben diesen plakativen Anwendungs­fällen schätze ich auch Funktionen in Photoshop, die einen näheren Bezug zu meiner Arbeits­praxis haben: Von verpixelten Fotos kann ich mit den neuronalen Filtern JPEG-Arte­fakte entfernen, Fotos mit kleinen Bildmaßen kann ich mit »Super Zoom« sogar irritierend gut vergrößern. Sinnvoll ist auch, Motive stilistisch aneinander anzupassen, die insbe­sondere bei begrenztem Budget aus verschiedenen Quellen (Stockfoto-Daten­banken) kommen. Die Harmonisierung oder Farbübertragung mittels KI macht es möglich.

Spannend wird noch, wie Bilder nicht mehr nur verändert, sondern sogar erzeugt werden. Mit »Dream Fusion« von Google oder »Point-E« von OpenAI gab es kürzlich den nächsten Entwicklungs­sprung: Diese Tools können Abbildungen von dreidimensionale Figuren generieren. Noch sind sie nicht bereit für den kommerziellen Einsatz, aber das wird kommen, bestimmt.

Von künstlicher Intelligenz generierte Texte

Eine echte Entdeckung war »Neuroflash« für mich. Neuroflash ist eine KI-gestützte Software zur Text­gene­rierung mit Fokus auf dem deutsch­sprachigen Raum. Aus wenigen Schlag­worten werden ganze Blogbeiträge geschrieben, Gliederungs­vorschläge on top – und das in einer Qualität, die Texten mensch­lichen Ursprungs nicht nachsteht. Ortho­grafisch hat sie sicher das Potenzial, den menschlichen Durch­schnitt sogar zu übertrumpfen. Auch stilistisch bietet Neuroflash bereits einen Spielraum:

KI beim Schreiben kann viele verschiedene Formen annehmen. Einige Programme basieren auf statistischen Modellen und lernen durch den Vergleich mit anderen Texten, welche Wörter am häufigsten verwendet werden und wie sie am besten kombiniert werden. Andere Pro­gramme verwenden Machine Learning-Algorithmen, um Lektionen aus den Korrekturen der Nutzer zu lernen und so zu verbessern. Die Vorteile von KI beim Schreiben liegen auf der Hand: Es ist schnell, es ist leicht zu benutzen und es bietet einen qualitativen Vorteil gegenüber Menschen. Die Nachteile liegen jedoch auch auf der Hand: KI ist kein Ersatz für menschliche Erfahrung und Kompetenz und es gibt Grenzen für das, was es tun kann.

Und? Haben Sie es gemerkt? Den vorherigen Absatz habe ich nicht geschrieben, sondern eine künstliche Intelligenz. Mein menschliches Zutun beschränkte sich auf die Vorgabe bestimmter Schlagworte und der Auswahl eines Text­vorschlags. In dieser Form wird die künstliche Intelligenz von Agenturen und Webdesigner*innen bereits kommerziell genutzt. Typische SEO-Texte, die vordergründig zur besseren Auffindbarkeit mit Google & Co. formuliert werden, können jetzt schon maschinell verfasst werden.

Praktische Verwendung erfuhr Neuroflash bei mir – immer noch testweise – vor Kurzem, als ich Ideen für einen Claim sammelte. Die künstliche Intelligenz hat mehrere Vorschläge generiert, von denen 1–2 in die engere Auswahl gekommen sind. Gegenüber der Kundschaft bin ich damit transparent umgegangen.

Künstliche Intelligenz programmieren lassen

Auch ChatGPT von OpenAI ist in aller Munde. Dabei handelt es sich um einen Chatbot – und vielleicht dem bisher »menschlichsten« (menschenähnlichsten) seiner Art. ChatGPT baut auf GPT auf, dem »Generative Pretrained Transformer«, aktuell in der Version 3. Mit einem beeindruckend guten kontextuellem Verständnis beantwortet ChatGPT individuelle Fragen oder nimmt Aufgaben an (»Schreibe ein Gedicht über …«). Spannend für Webdesigner*innen: Der Chatbot kann dabei auch programmieren. ChatGPT beherrscht unter anderem die Auszeichnungs­sprache HTML, die Formatierungs­sprache CSS und die Skript­sprache JavaScript, die allesamt für die Web­entwicklung relevant sind:

Ein Screenshot von ChatGPT, wie es eine kleine JavaScript-Funktion programmiert

Ganze Websites programmieren sich in diesem Rahmen nicht von alleine. Kleinere Fleiß­auf­gaben kann man aber offenbar der künstlichen Intelligenz überlassen. Besonders spannend finde ich, dass ChatGPT (übrigens trotz eigener Fehler­anfällig­keiten in seinen Antworten) auch in der Lage ist, Fehler in Codes ausfindig zu machen. ChatGPT kann auch übermittelte Codes vereinfachen und damit elegantere Ergeb­nisse erzielen.

Mein Blick in die Zukunft

Mein ganz eigenes, persönliches Fazit als Grafik- und Webdesigner – und explizit nicht als KI-Experte, Soziologe oder Ökonom: Um meinen eigenen Beruf mache ich mir aktuell wenig Sorgen. Mit Blick auf meine Arbeit freue ich hauptsächlich über die Erleichterungen. Insbesondere bei der Bildbearbeitung entfiel schlichtweg Fleißarbeit. Den Kern meiner Arbeit sehe ich darin nicht ersetzt, eher kann ich mich auf diesen konzentrieren. Ich kann mir jedoch vorstellen, dass sich in einem fließenden Verlauf größere Agenturen personell anders aufstellen: Weniger Stellen mit einzigem Schwerpunkt auf Bildretusche, dafür mehr konzeptionelle und redaktionelle Arbeit. Aber auch die redaktionelle Arbeit wird sich verschieben: Neuroflash oder Chatbots zeigen, wie gut auch Maschinen texten können.

Neben Veränderungen auf dem Arbeitsmarkt mache ich mir aber auch Gedanken darüber, welche Auswirkungen Inhalte haben, die mit künstlicher Intelligenz verändert oder erstellt wurden. Mir ist beispielsweise etwas mulmig dabei, dass Gesichtsausdrücke mit Photoshop spielend verändert (verfälscht?) werden können. Zwar ist Bildmanipulation keineswegs neu, aber ich sehe darin dennoch ein Novum, weil sie Bildretusche neu definiert. Sie hatte ihren Fokus auf Schönheitskriterien: Typischerweise ging es um das Verstecken von Poren und Pickeln, manchmal wurden auch Zähne weiß gemacht oder Körperproportionen mehr oder weniger gekonnt verändert. Dazu kann man auch verschiedene Meinungen haben, aber für mein Gefühl haben diese Beauty-Korrekturen weniger das Potenzial, die Bildaussage grundsätzlich zu ändern. Das sehe ich bei den neuronalen Filtern anders. Mit den Fortschritten in der künstlichen Intelligenz wird auch die Medienkompetenz wachsen müssen, um Manipulationen besser enttarnen zu können.

Den Einsatz künstlicher Intelligenz vor allem für längere Texte würde ich gegenwärtig mit Risiken abwägen, die damit einhergehen, wenn auffliegt, dass der Text keinen menschlichen Urheber hat. Ironischerweise arbeitet man zur Erkennung automatisch generierter Texte auch wieder künstlicher Intelligenz. Sobald diese Erkennung zuverlässig funktioniert und bei Ihren Texten ausschlägt, könnten sich Menschen davon getäuscht fühlen. Vorsicht ist auch geboten, keinen »Duplicate Content« zu erstellen – denn wie stellt die künstliche Intelli­genz sicher, dass ihre Text­ergebnisse einmalig sind? Duplikate werden von den Such­maschinen konsequent negativ bewertet. Und darüber hinaus halte ich es auch für möglich, dass Suchmaschinen mit Algo­rithmen zukünftig unter­scheiden, welche Inhalte mit künstlicher Intelligenz verfasst wurden. Das kann zur Bewertung der Relevanz ein Kriterium werden, denn ich sehe eine inhaltliche Schwäche in automatisch generierten Texten: Die künstliche Intelligenz schafft nichts, wozu ein Mensch grundsätzlich nicht auch in der Lage wäre – mit etwas mehr Zeit, jedenfalls. Das ist darin begründet, dass die künstliche Intelligenz aktuell hauptsächlich auf der Grundlage bekannter Muster arbeitet. Mit neuen, kreativen, kritischen und unter diesen Gesichtspunkten relevanten Inhalten tut sich künstliche Intelligenz schwer. Neue Denkansätze liefert sie noch nicht. Eine weitere Problem­stellung ist auch, dass eine künstliche Intelligenz auch nicht zwangsläufig fehlerfreie Antworten gibt. Obgleich es trotzdem eine große Hilfe ist, muss man die fehlerhaften Antworten erkennen können – eben als Mensch.

Deshalb werden es bestimmt auch Menschen sein, die in Zukunft darüber entscheiden müssen, ob sich das Gesetz mit diesen Veränderungen auch bewegen muss: Was ist mit dem Urheberrecht, wenn Werke keinen menschlichen Urheber mehr haben? Mit welchen Inhalten dürfen Algorithmen überhaupt maschinell angelernt werden? Gibt es sogar Persönlichkeitsrechte oder andere Rechte für KI-generierte Porträts? Gibt es eine rechtliche Pflicht, KI-generierte Inhalte zu kennzeichnen?

Ein Roboter hält eine grüne Paprika

Meinen Denkanstoß für diesen Artikel hat die Art Direktorin Chantal Dowald auf LinkedIn gegeben, die in die Runde gefragt hat, wie man zu Texten für soziale Medien steht, die mit künstlicher Intelligenz erzeugt wurden.

P.S.

Vielleicht bald altmodisch, aber hier werden die Inhalte noch mit Hand geschrieben. 😊

P.P.S.

Aber das Titelbild dieses Artikels habe ich bereits mit künstlicher Intelligenz generiert. Ich habe DALL·E 2 von OpenAi mit dieser Aufgabe gefüttert: »minimal 3d render of a robot holding a green pepper in front of a computer in dark room, digital art«.