Style Transfer von Foto zu Impressionismus
Um den Stiltransfer in der Praxis zu demonstrieren, verwenden wir die Open Source Software InvokeAI, ein leistungsstarkes Werkzeug für die KI-gestützte Bildgenerierung.
Zunächst wählen wir eine Fotografie eines Baumes als Inhaltsbild aus. Dann wählen wir einen impressionistischen Malstil als Stilbild. Mit InvokeAI können wir diese beiden Bilder kombinieren und ein neues Bild erzeugen, das den Inhalt des Baumes mit dem Stil des Impressionismus vereint.
Die Fotografie eines Baumes wird als Ausgangspunkt für die Transformation verwendet. Der nächste Schritt besteht darin, diese Fotografie in ein impressionistisches Konzeptkunstgemälde zu verwandeln.
Um das zu erreichen, wechseln wir zunächst zu einem Konzeptkunst (Malerei) Stil. Wir fügen dann ein "Impressionismus++ Gemälde eines Eichenbaums" hinzu.
Der Denoising-Wert wird angepasst, um die Transformation zu steuern:
- Denoising bei 0.5
- Denoising bei 0.75
- Denoising bei 0.9
Es ist zu beobachten, dass bei einem Denoising-Wert von 0,5 das Ergebnis bereits recht ansprechend ist, da es den fotografischen Stil in den Malstil verändert. Bei einem Denoising-Wert von 0,9 verliert das Bild die Ähnlichkeit mit der ursprünglichen Form des Baumes, und es kommt zu Verformungen.
ControlNets für mehr Kontrolle beim Stiltransfer
ControlNets sind eine Klasse neuronaler Netze, die entwickelt wurden, um die Steuerung von KI-gestützten Bildgenerierungsprozessen zu verbessern. Sie ermöglichen es, bestimmte Merkmale oder Attribute eines Bildes gezielt zu beeinflussen, wie z. B. Kanten, Formen, Tiefeninformationen oder semantische Segmentierungen.
Tile ControlNet dient als Farbführung und versucht, die Farbinformationen des Originalbildes während der Generierung beizubehalten. Es wird demonstriert, wie der Tile ControlNet die Farbpalette des ursprünglichen Eichenbaumbildes erhalten kann, während die AI den fotografischen Stil in den Malstil verändert.
- Das ursprüngliche Bild wird als Rasterebene in die Leinwand geladen.
- Eine neue ControlNet-Ebene wird aus der Rasterebene erstellt.
- Als ControlNet-Modell wird Tile ControlNet ausgewählt.
Es kann jedoch beobachtet werden, dass der Tile ControlNet die Struktur und Form des Baumes aus dem Originalbild nicht beibehalten kann, sodass das resultierende Bild die ursprüngliche Form verliert.
Style Transfer zu Fotorealismus
Eine weitere spannende Anwendung des Stiltransfers ist die Umwandlung von Gemälden oder Zeichnungen in fotorealistische Bilder. Hierbei wird versucht, die Details und Texturen eines echten Fotos auf ein künstliches Bild zu übertragen.
Um den ursprünglichen Malstil zu entfernen, müssen wir die Details des Originals aus dem Bild extrahieren.
Mit einer höheren Denoising-Stärke wird das Bild stärker verändert und verliert die Form. Aus diesem Grund werden Control-Layer verwendet, um diesen Prozess zu steuern.
Canny ControlNet zum Beispiel wird verwendet, um die Struktur zu erhalten. Durch das Herausfiltern irrelevanter Strukturen mithilfe des High Threshold und des Low Threshold des Canny ControlNet verbessert sich der Prozess.
Insgesamt kann mit den im Video demonstrierten Schritten ein Porträt eines italienischen Guts relativ einfach in ein überzeugendes fotorealistisches Bild verwandelt werden.
Zusammenfassend lässt sich sagen, dass Sie, wenn Sie Kontrolle wollen und den Stiltransfer etwas genauer haben möchten, versuchen, Leitplanken an diesen Prozess anzubringen. Man will der KI nicht freien Lauf lassen. Sie soll es nicht völlig neu erfinden, sondern ihr Leitplanken geben.