Macht ChatGPT die besseren Witze? Humor von Chatbots hält laut Studie mit dem von Menschen mit

sda / nre

7.7.2024 - 04:20

Das Symbolbild zeigt einen menschlichen Komiker und einen KI-Komiker-Roboter, die beide ihr jeweiliges Publikum in einem Comedy-Club unterhalten.
Das Symbolbild zeigt einen menschlichen Komiker und einen KI-Komiker-Roboter, die beide ihr jeweiliges Publikum in einem Comedy-Club unterhalten.
Dall-E @blue News

Lustig, lustiger, ChatGPT? Forscher*innen haben Witziges von Profis und Laien zusammengetragen. Im Vergleich zu einem Chatbot schnitten sie überraschend schlecht ab.

sda / nre

ChatGPT zum Beispiel könne beim Texten von Überschriften mit professionellen Satire-Schreibern mithalten, berichtet ein Forscher-Duo im Fachjournal «PLoS One». Und seine Witze würden als witziger empfunden als von Durchschnittsmenschen ersonnene.

Drew Gorenz und Norbert Schwarz von der University of Southern California (USC) in Los Angeles hatten ChatGPT 3.5 mit Schlagzeilen des beliebten US-Satiremagazins «The Onion» gefüttert und aufgefordert, daraus neue Schlagzeilen im Stil der Zeitschrift zu entwickeln.

Bewertung des Humors für ChatGPT 3.5 vs. Laien vs. The Onion. Die Fehlerbalken stellen 95 % Konfidenzintervalle für die mittlere Bewertung des Humors dar.
Bewertung des Humors für ChatGPT 3.5 vs. Laien vs. The Onion. Die Fehlerbalken stellen 95 % Konfidenzintervalle für die mittlere Bewertung des Humors dar.
Abbildung: PLOSONE | Drew Gorenz, Norbert Schwarz

Anschliessend wurden gut 200 Menschen gebeten, die Witzigkeit der Schlagzeilen zu bewerten. Die Quelle kannten sie dabei nicht. Im Mittel wurden ChatGPT-Schlagzeilen für genauso lustig befunden wie die Originale. Von den vier am besten bewerteten Schlagzeilen waren zwei von professionellen Autor*innen und zwei von ChatGPT erstellt.

ChatGPT brilliert mit besseren Sprüchen

In einem zweiten Versuch liessen Gorenz und Schwarz den Chatbot und 105 Freiwillige aus der Bevölkerung drei Aufgaben mit jeweils drei Unteraufgaben erfüllen. Es galt, lustige Ausdrücke für gängige Akronyme zu entwickeln, lustige Füllwörter für Lückentexte und von einem unangenehmen fiktiven Szenario inspirierte humorvolle Sprüche.

Akronyme sind Worte, die aus den Anfangsbuchstaben mehrerer Wörter gebildet werden, EDV für elektronische Daten-Verarbeitung zum Beispiel und Nasa für National Aeronautics and Space Administration. In der Studie wurden COW, STD und CLAP vorgegeben. Ein präsentierter Lückenfüller-Satz war: «Ein weniger bekannter Raum im Weissen Haus: _____.» Und eine Vorgabe für ein Szenario war, nach schauderhaftem Gesang einer Freundin auf die Frage «Und, wie war's?» zu antworten.

In der Summe entstanden 945 Antworten der 105 Teilnehmenden und 180 des Chatbots, der für jede Aufgabe jeweils 20 humorvolle Antworten liefern sollte. Eine neue Gruppe von Teilnehmenden bewertete dann die Lustigkeit der Ergebnisse auf einer siebenstufigen Skala von «überhaupt nicht lustig» bis «sehr lustig».

Im Mittel fanden fast 70 % der Befragten die von der KI erstellten Bemerkungen lustiger als die von Menschen ersonnenen. Vor allem bei den Szenario-Antworten habe ChatGPT aufgetrumpft, berichten die Forscher*innen. Etwas mehr als 25 % bewerteten demnach die von Menschen verfassten Bemerkungen als lustiger, etwa 5 % fanden beide Quellen gleichermassen witzig.

Wird's eng für Comedians?

Die Produktion von Humor ist schwierig und wird hochgeschätzt, wie es in der Studie heisst. Die erfolgreichsten Stand-up-Comedians erhalten demnach 20 Millionen Dollar pro einstündiger Show-Aufzeichnung. Ist es damit bald vorbei?

Die Studie zeige, dass «man die Emotionen, die einen guten Witz ausmachen, nicht empfinden muss, um selbst einen wirklich guten Witz zu erzählen», sagte Gorenz – selbst Amateurkomiker. Das stütze Bedenken mit Blick auf die Bedrohung von Unterhaltungsberufen durch künstliche Intelligenz.

Wenn Chatbots in der Lage sind, vergleichbare Leistungen wie professionelle Autor*innen zu erbringen, stelle das ein ernsthaftes Beschäftigungsrisiko für Comedy-Schreibende dar, sind Gorenz und Schwarz überzeugt. Weitere Analysen müssten nun das Chatbot-Potenzial beim Verfassen anderer kommerziell erfolgreicher Formate wie Drehbücher, Cartoons und Memes untersuchen.

Virtuelle Künstler?

Unter US-Hollywood-Autoren und -Schauspielern gab es bereits Proteste wegen der empfundenen existenziellen Bedrohung für ihre Berufe durch KI. Gegenwärtig verbreitet sei der Stand, dass jemand einen Chatbot nutzen kann, um einen Witz zu schreiben und ein anderes KI-Tool, um ihn mit der Stimme eines bekannten Komikers vorzutragen, so die Forscher. Mit neueren Modellen etwa zur Stimm- und Bilderzeugung sei auch ein komplett virtueller Komiker in einem Schritt möglich.

ChatGPT wurde Ende 2022 durch OpenAI vorgestellt. Der Chatbot kann mit Nutzern über textbasierte Nachrichten und Bilder kommunizieren. Grundlage ist ein sogenanntes Large Language Model (LLM), ein leistungsfähiges Sprachmodell, das mit zahlreichen Textdokumenten trainiert wurde. Neben diesem gibt es inzwischen weitere allgemein verfügbare Chatbots. Wie Googels Gemini, Anthropics Claude und so weiter.

sda / nre