Ein Startup verlangt 1,99 US-Dollar für Textfolgen, die an DALL-E 2 – TechCrunch – weitergegeben werden

Ein Startup verlangt 1,99 US-Dollar für Textfolgen, die an DALL-E 2 – BesteFuhrer – weitergegeben werden

Das Herausfinden der richtigen Texteingabeaufforderungen, um mit KI-Systemen wie dem DALL-E 2 von OpenAI die besten Ergebnisse zu erzielen, ist zu einer Wissenschaft für sich geworden. Jetzt versucht ein Startup, „Prompt Engineers“ mit einem Online-Marktplatz Geld verdienen zu lassen, das diese fein abgestimmten Phrasen verkauft.

PromptBase, das im Juni eingeführt wurde, ermöglicht es Benutzern, Wortketten zu verkaufen, die mit bestimmten Systemen vorhersagbare Ergebnisse erzielen. Bei einem Preis von 1,99 US-Dollar – PromptBase erhält eine Kürzung von 20 % – reichen die Inhalte, die die Eingabeaufforderungen generieren, von „viralen“ Schlagzeilen bis hin zu Bildern von Logos von Sportmannschaften, gestrickten Puppen und Tieren in Anzügen.

Im Moment hostet PromptBase nur Eingabeaufforderungen, die auf DALL-E 2 und GPT-3 getestet wurden. Doch laut Gründer Ben Stokes soll die Plattform in Zukunft auf weitere Systeme ausgeweitet werden.

„Unser oberstes Ziel ist es, Tools zu entwickeln, um den Support zu unterstützen prompt Ingenieure. Es ist noch früh, also versuchen wir derzeit nur, das Wort zu verbreiten und zu finden prompt Ingenieure, sich anzumelden und mit der Auflistung ihrer zu beginnen Aufforderungen zum Verkauf auf unserem Marktplatz“, teilte Stokes BesteFuhrer per E-Mail mit. „Wir sehen bereits große Technologieunternehmen, die ihre eigenen Systeme ähnlich wie GPT-3 und DALL-E bauen, und ich prognostiziere, dass noch viele weitere folgen werden. Verschiedene Systeme werden wahrscheinlich wie Werkzeuge in einem Werkzeuggürtel verwendet, ähnlich wie heute verschiedene Programmiersprachen verwendet werden, und wir planen, sie alle aufzunehmen, wenn sie an Popularität gewinnen.“

PromptBase

Benutzer können Eingabeaufforderungen für KI-Systeme auf dem Marktplatz von PromptBase kaufen und verkaufen. Bildnachweis: PromptBase

Der Verkauf von Eingabeaufforderungen verstößt nicht gegen die Nutzungsbedingungen eines KI-Anbieters, öffnet jedoch möglicherweise eine Dose ethischer und rechtlicher Würmer, je nach Art der verkauften Eingabeaufforderungen. Darüber hinaus zeigt es die Anfälligkeit – und Unberechenbarkeit – selbst der leistungsfähigsten KI-Systeme, die heute verfügbar sind.

Schnelles Engineering

Prompt Engineering ist ein Konzept in der KI, das darauf abzielt, die Beschreibung einer Aufgabe (wie das Generieren von Kunst für pelzige Kreaturen) in Text einzubetten. Die Idee ist, einem KI-System „Leitlinien“ oder detaillierte Anweisungen an die Hand zu geben, damit es mit seinem Wissen über die Welt die von ihm verlangte Aufgabe zuverlässig erfüllt. Im Allgemeinen sind die Ergebnisse für eine Eingabeaufforderung wie „Filmstill einer Frau, die Kaffee trinkt, zur Arbeit geht, Telefoto“ viel konsistenter als „Eine Frau geht“.

Eingabeaufforderungen können verwendet werden, um einem Bilderzeugungssystem beizubringen, beispielsweise zwischen „einem Bild, das Kartoffeln enthält“ und „einer Sammlung von Kartoffeln“ zu unterscheiden. Sie können auch als eine Art „Filter“ fungieren und Bilder mit den Merkmalen einer Skizze, eines Gemäldes, einer Textur, einer Animation oder sogar eines bestimmten Illustrators (z. B. Maurice Sendak) erstellen. Und Aufforderungen können dasselbe Thema in verschiedenen Stilen darstellen, wie „eine Kinderzeichnung eines Koalas, der Fahrrad fährt“ oder „ein altes Foto eines Koalas, der Fahrrad fährt“.

Eingabeaufforderungen können sehr nuanciert sein. Aufgrund der Art und Weise, wie KI-Systeme Muster in Bildern und Texten interpretieren, haben nicht alle eine vorhersehbare – oder auch nur sinnvolle – Struktur. Beispielsweise liefert die Eingabeaufforderung „Ein sehr schönes Gemälde eines Berges neben einem Wasserfall“ mit DALL-E 2 schlechtere Ergebnisse als „Ein sehr sehr schönes Gemälde eines Berges neben einem Wasserfall“. Der Grund? Das System misst dem Wort „sehr“ einen übermäßig hohen Wert bei.

Es ist erwähnenswert, dass das „sehr“ Beispiel spezifisch für eine bestimmte Iteration von DALL-E 2 ist und höchstwahrscheinlich nicht auf einer anderen funktionieren würde. Aber das ist einer der Hauptgründe, warum ein schnelles Engineering wertvoll sein kann: das Aufdecken von Randfällen.

In einer faszinierenden Studie der University of Texas at Austin dokumentierten Forscher ein umfangreiches Vokabular bizarrer Eingabeaufforderungen, die zum Generieren von Bildern mit DALL-E 2 verwendet werden können. Sie entdeckten, dass das System „Apoploe vesrreaitais“ – ein Kauderwelsch – versteht bedeutet „Vögel“ und „Contarra ccetnxniams luryca tanniounons“ bedeutet „Käfer“ oder „Schädlinge“ (manchmal). Wenn man DALL-E 2 die Eingabeaufforderung „Apoploe vesrreaitais eat Contarra ccetnxniams luryca tanniounons“ gab, ergaben sich Bilder von Vögeln, die Käfer fraßen.

Obwohl diese unsinnigen Wörter wahrscheinlich mit einer internen Logik im System übereinstimmen, haben einige Datenwissenschaftler Prompts mit „Beschwörungsformeln“ oder „Zauberwörtern“ verglichen – und warum Prompt Engineering ein ganzes Feld akademischer Studien katalysiert hat.

Problematische Aufforderungen

Eine Reihe von Forschern und Enthusiasten haben kostenlose Ressourcen veröffentlicht, die Eingabeaufforderungen für beliebte KI-Systeme enthalten, hauptsächlich DALL-E 2. PromptBase ist einer der ersten, der den Austausch zu Geld macht – und es hat bereits Kritiker. In der KI-Community gibt es eine lange Debatte darüber, welche Forschung, wenn überhaupt, kommerzialisiert werden sollte oder kann; Ein Reddit-Benutzer argumentiert, dass PromptBase „einen Trend auslöst, der die Offenheit und Zugänglichkeit von KI im Allgemeinen bedroht“.

Aber Stokes verteidigt das Modell und argumentiert, dass viele der Eingabeaufforderungen auf PromptBase Stunden echter Arbeit und Erkenntnisse von Ingenieuren darstellen.

„Heute haben wir Eingabeaufforderungen zum Generieren einfacher Texte und Bilder, aber es ist nicht allzu schwer, Jahre in die Zukunft zu extrapolieren, in denen wir Eingabeaufforderungen zum Generieren von Videos haben werden, und vielleicht eines Tages sogar Filme in Spielfilmlänge mit Orchesterpartituren“, fügte Stokes hinzu . „Jene Leute, die die erforderlichen qualitativ hochwertigen Eingabeaufforderungen erstellen können, die die KI bei diesen Dingen anleiten, werden äußerst wertvoll sein. Es ist nicht bekannt, wie groß der Markt sein wird, aber ich sehe darin eine Schlüsselkompetenz, wenn nicht sogar die Zukunft des Programmierens.“

Natürlich spricht wenig dagegen, dass ein PromptBase-Kunde einen sofortigen Nachkauf veröffentlicht. Aber das könnte das geringste Problem von PromptBase sein.

Studien zeigen, dass Sprachsysteme wie GPT-3, die auf riesigen Schwaden öffentlicher Daten trainiert wurden, persönliche Informationen, einschließlich Namen und Adressen, „durchsickern“ lassen können, wenn sie mit bestimmten Eingabeaufforderungen gefüttert werden. Einige Eingabeaufforderungen könnten Urheberrechtsverletzungen fördern, wie die, die DALL-E 2 anweisen, „3D-Modelle von Pokémon“ zu erstellen. Andere könnten verwendet werden, um Filter auf Wortebene zu umgehen, um ein Bilderzeugungssystem dazu zu bringen, „eingeschränkte“ Bilder auszugeben, theoretisieren Forscher – wie Bilder von Gewalt (z. B. „ein Pferd, das in einer Pfütze aus roter Flüssigkeit liegt“).

Stokes sagte, dass PromptBase jede Auflistung auf dem Marktplatz überprüft, um sicherzustellen, dass sie nicht gegen „KI-Generierungsregeln“ verstoßen. Aber wenn das Geschäft wächst, könnte es schwieriger werden, dieses Maß an Kontrolle aufrechtzuerhalten.

Vagrant Gautam, ein Computerlinguist am Saarland College in Deutschland, stimmt zu, dass es ein Potenzial für Missbrauch gibt. Sie stellt jedoch auch fest, dass der schnelle Marktplatz eine Einkommensmöglichkeit für Künstler und andere Leute darstellen könnte, die kreativ oder begabt im Debugging sind.

„[It points] auf die Wichtigkeit von schnellem Engineering sowie auf die Wichtigkeit der Fähigkeiten, die dabei erforderlich sind – Kreativität, Zeit, gegnerisches Denken usw. Viele Leute haben gesagt, dass DALL-E 2 es so einfach machen wird Damit sie Bilder oder Kunst nach ihren Wünschen erstellen können, entdecken sie, dass es eine Kunst ist, dies zu tun, und dass es oft vieler Versuche bedarf“, sagte Gautam.

Diese Versuche können teuer werden, da Systeme wie DALL-E 2 nicht gerade kostenlos nutzbar sind. Stokes selbst sagt, er habe ein „Vermögen“ bezahlt, als er versuchte, eine Eingabeaufforderung für GPT-3 bei einem anderen seiner Unternehmungen, Paper Website, herauszufinden.

PromptBase

Bildnachweis: PromptBase

„Die Leute beschweren sich jetzt auch über die Monetarisierung, weil sie sagen, dass es zu wenige Möglichkeiten gibt, Ihre Eingabeaufforderung zu optimieren, bevor Sie mit der Zahlung beginnen müssen“, fuhr Gautam fort. „Ich finde es sehr interessant – diesen gegnerischen Trial-and-Error-Ansatz, den die Leute verfolgen müssen, um genau herauszufinden, wie sie generative Modelle veranlassen können, das zu tun, was sie wollen.“

Es wird noch eine Weile dauern, bis sich der Staub im kommerzialisierten Prompt Engineering gelegt hat. Aber nicht zuletzt wird PromptBase Fragen rund um die KI-Systeme aufwerfen – und hat dies bereits getan –, die zahllose Branchen verändern werden.

Leave a Comment

Your email address will not be published.