s3nnet am :
Nice… Soll ich dann Teil 2 machen?
Während Bings Bildgenerator geschickt auf simplizierende Produkttauglichkeit getrimmt war, ist Nightcafe einerseits ein Komplexitätsmonster, gleichzeitig aber auch eine Communityplattform. Ein Blick in die widersprüchliche Parallelwelt.
Zuerst zur Bildererstellung. Um ein Bild herauszukriegen ist natürlich wieder ein Beschreibungstext (= Prompt) zu schreiben und es gibt dafür täglich neue Credits. Aber damit hören die Gemeinsamkeiten zu Bing bei der reinen Bilderstellung auch schon auf. Denn während da das bildgenerierende Modell vorgegeben ist (DALL·E 3), ist es bei Nightcafe auswählbar. Es gibt tatsächlich eine große Auswahl. Und das hat einen Zweck, denn die Modelle sind bei unterschiedlichen Aufgaben gut – es ist also gar nicht absurd, die zu wechseln und Alternativen auszuprobieren. Beispielsweise produziert Flux fast immer visuell hübsche Bilder, während Googles Imagen 3.0 viel besser darin ist, Elemente der Beschreibung nicht zu ignorieren.
Zusätzlich zur Modellauswahl gibt es sogar weitere Optionen. Beispielsweise Presets, was Sammlungen von Beschreibungswörtern sind, die dem Prompt hinzugefügt werden und eine bestimmten Stil bewirken sollen. Oder Prompt Magic, bei dem der Beschreibungstext aufgebauscht wird, was mit manchen Modellen dem Ergebnis helfen kann. Andere Optionen sind ganz abhängig vom genutzten Modell, z.B. beherrscht Ideogram 2a Optionen für den gesuchten Stil (wie Realismus oder 3D-Rendering). Auch können bei manchen Modellen Bilder als Startpunkt für die Generierung genommen werden.
Sowieso, nach der Erstellung eines Bildes ist die Sache nicht rum. Sondern man kann das Bild danach weiterbearbeiten, es beispielsweise hochskalieren oder man markiert einen Bereich, der bei einem nächsten Generierungsschritt ausschließlich verändert werden soll. Letzteres funktionierte bei mir nie gut, aber der mögliche praktische Nutzen einer solchen Korrekturfunktion ist ersichtlich.
Von mir nicht getestet war die grundsätzlich sehr mächtige Funktion, eigene Modelle anzulernen, also Finetuning. Dabei füttert man ein Modell mit einigen Bildern, damit die später generierten ihnen ähneln. Um die Funktion zu benutzen braucht es aber ein Abonnement. Das Abonnement verschafft auch sonst weiteren Zugriff, schaltet z.B. bessere Modelle (wie Flux Pro) frei und gibt zusätzliche Credits. Die sind ohne Abo auf 5 am Tag beschränkt, wobei durch Interaktion mit der Seite schnell weitere als Belohnung der Gamification hinzukommen können.
Die oben beschriebene Bildererstellung nach einem Beschreibungstext ist dem Aufbau der Seite nach die Hauptfunktion von Nightcafe, der Funktionsumfang ist aber größer. Man kann beispielsweise auch Videos erstellen (bzw animierte Bilder), Skizzen zu Bilder vervollständigen lassen, den Stil eines Bildes auf andere übertragen und noch einiges mehr.
Interessanterweise verbindet Nightcafe diese umfangreichen technischen Funktionen mit einem sehr ausgebauten Communityaspekt. So können erstellte Bilder in einen Bilderstream veröffentlicht werden, wo dann andere Nutzer Likes verteilen, kommentieren oder sogar die Bilder remixen. Den Nutzern kann man folgen und bekommt dann eher ihre Bilder präsentiert. Es gibt einen Chat und Chaträume, via denen dann auch Challenges ablaufen. Das sind kollektive Bildererstellungsziele, bei denen die Sieger nach Abstimmung mit Credits prämiert werden.
Dieser Aspekt der Communitybildung wird sogar ausgebaut. So kam kürzlich ein Feed hinzu, bei dem ähnlich Facebook Posts erstellt werden können und wo – anders als beim plattformweiten Bilderstream unter Explore – die Nutzer eher im Zentrum stehen als die Bilder. Denn dort wird direkt ihr Name angezeigt. Und sie dürfen sofort sichtbare Texte schreiben, was nochmal an Facebook etc erinnert.
Selbst wenn man kritisch zum KI-Hype steht, Nightcafe ist auf verschiedenen Ebenen interessant.
Durch das Anbieten von vielen Modellen und Funktionen bietet die Seite einen tiefen Einblick in das Feld der Bildgeneratoren. So kann man hier lernen, welche Modelle bei welchen Bildern Stärken haben bzw überhaupt anschaulich mitbekommen, dass es viele verschiedene Modelle gibt.
Das macht dann deutlich, dass es zwar durchaus eine bestimmte KI-Ästhetik gibt. Aber auch, dass die sich mit dem jeweiligen Modell bzw den Modellgenerationen wandelt. Außerdem, dass die Leute mit ausgefeilten Beschreibungstexten und Einstellungen die Software doch sehr unterschiedliche Ergebnisse produzieren lassen können, wovon immer wieder welche auch gut und nicht wie KI-Schlock aussehen.
Der Ansatz der Seite ist auch abseits des Anwendungsfalls beachtenswert, wenn man selbst Webprojekte baut. Denn sie ist ein Beispiel für ein sehr starkes Fokussieren auf Communityaspekte, während aber trotzdem der funktionale Aspekt erstaunlich komplex ausgeliefert wird. Das wird bei Projekten sonst oft als Gegensatz gesehen, funktioniert hier aber scheinbar in Symbiose. Was daran liegen mag, dass ausgiebig und längerfristig mit den Bildgeneratoren zu spielen für eine relevante große Anzahl an Leuten ein ansprechendes Hobby zu sein scheint. Eine sichtbare Community zu haben gibt jedem Projekt eine Stetigkeit, die über ihren reinen funktionalen Nutzen hinausgeht, was hier wohl sehr bewusst angestrebt wird.
Genau da ist dann auch der Ansatzpunkt für Kritik. Bei Nightcafe wird sehr viel Energie für etwas verwendet, was über die reine Nützlichkeit der Software hinausgeht. Die Nutzer sollen die Bildgeneratoren trotzdem regelmäßig nutzen, wozu Funktionen wie Belohnungen für die tägliche Nutzung motivieren. Das schafft Nightcafe Bindung, verschwendet aber natürlich Strom. Diese Kritik sollte man dann auch wieder einschränken, Menschen machen viel was nicht direkt nötig ist und Energie verbraucht. Und schon ist man dann ganz schnell bei der generellen Diskussion um Bildgeneratoren und Sprachmodelle und wie erstrebenswert die Ergebnisse dieser Betätigung sind.
Ich finde, Nightcafe ist insgesamt einen Blick wert, und sei es nur als Anschauungsobjekt für diese Art der im momentanen KI-Hype verwurzelten Webprojekte, eben dieser Parallelwelt.
Nice… Soll ich dann Teil 2 machen?
Gerne, wenn auf deinem Blog würde ich den Artikel dann verlinken.
Oder wir bringen einfach beide Teile auf beiden Seiten?
Klar! Meine Erlaubnis hast du. Soll ich dir eine Mail mit dem Quellcode des Artikels schicken, oder arbeitest du mit dem HTML?
Ich mopse einfach das HTML
iberty.de am : PingBack
Vorschau anzeigen