Poesie ist Ansichtssache ChatGPT oder Shakespeare? Welche Gedichte kommen besser an?

dpa

18.11.2024 - 09:00

ChatGPT muss sich im Dicht-Vergleich mit William Shakespeare nicht verstecken.
ChatGPT muss sich im Dicht-Vergleich mit William Shakespeare nicht verstecken.
Dall-E

Eine neue Studie zeigt, dass Laien Gedichte von ChatGPT oft als schöner empfinden als die Werke berühmter Dichter. Die künstliche Intelligenz überzeugt durch Einfachheit und Rhythmus.

In einer aktuellen Studie erhielten Gedichte, die von ChatGPT verfasst wurden, höhere Bewertungen als die Werke von William Shakespeare und anderen bekannten Dichtern. Die Teilnehmer der Studie, die von Forschern der University of Pittsburgh durchgeführt wurde, fanden die KI-Gedichte im Allgemeinen ansprechender und rhythmischer, wie im Fachjournal «Scientific Reports» berichtet wird.

Die Forscher vermuten, dass die Einfachheit der von der KI generierten Gedichte für Laien leichter verständlich ist, was zu einer Bevorzugung dieser Poesie führt. Es könnte sein, dass die Teilnehmer die Komplexität menschlicher Gedichte missverstanden und sie als zusammenhangslose Wortansammlungen interpretierten, die von der KI stammen könnten.

Missverständnisse bei der Zuordnung von Gedichten

Im Rahmen der Untersuchung wurden 1634 Teilnehmern jeweils zehn Gedichte präsentiert. Die meisten dieser Teilnehmer waren keine Poesie-Experten und lasen nur gelegentlich Gedichte. Unter den präsentierten Gedichten befanden sich fünf Werke von bekannten englischsprachigen Dichtern wie Shakespeare und T.S. Eliot, während die anderen fünf von ChatGPT im Stil dieser Autoren generiert wurden.

Mehr als die Hälfte der Teilnehmer glaubte, dass die KI-Gedichte von Menschen verfasst worden waren. Interessanterweise waren die fünf Gedichte, die am seltensten als menschlich erkannt wurden, tatsächlich von menschlichen Dichtern geschrieben.

Die Teilnehmer hatten generell Schwierigkeiten, die Gedichte korrekt zuzuordnen, was die Forscher als Hinweis darauf deuten, dass die Aufgabe herausfordernd war und oft geraten wurde.

In einem zweiten Experiment bewerteten 696 andere Teilnehmer die Gedichte nach Kriterien wie Qualität, Schönheit, Gefühl, Rhythmus und Originalität. Die KI-Gedichte übertrafen die menschlichen Werke in 13 von 14 Kategorien, allerdings nur, wenn die Teilnehmer nicht wussten, wer die Gedichte verfasst hatte. Sobald die Urheberschaft bekannt war, schnitten die KI-Gedichte schlechter ab.

Ein Gedicht im Stil von Ginsberg überzeugt

Ein besonders oft falsch zugeordnetes Gedicht war ein KI-Werk im Stil von Allen Ginsberg. «Fast 70 Prozent der Teilnehmer hielten es für ein menschliches Werk», erklärt Co-Autor Brian Porter. Die erste Strophe des Gedichts lautet:

«In the stillness of the night | I hear the beat of the city's heart | The rhythm of the streets, the pulse of life | A symphony of chaos, a work of art» (übersetzt: «In der Stille der Nacht | Höre ich den Herzschlag der Stadt | Den Rhythmus der Strassen, den Puls des Lebens | Eine Symphonie des Chaos, ein Kunstwerk»)

Diese Gedichte wurden 2023 mit ChatGPT 3.5 erstellt. «Ich habe kürzlich mit ChatGPT 4 und 4o experimentiert», sagt Porter. «Die neueren Modelle scheinen besser im Erreichen des erwarteten Versmasses zu sein, wie dem jambischen Fünfheber von Shakespeare, aber ich sehe keine wesentlichen inhaltlichen Fortschritte.»

Unter den menschlichen Dichtern war Allen Ginsberg bei der Studie einer der beliebtesten.
Unter den menschlichen Dichtern war Allen Ginsberg bei der Studie einer der beliebtesten.
Imago

KI in anderen kreativen Bereichen

Eine weitere Studie zeigte, dass die Witze von ChatGPT als humorvoller empfunden wurden als die von Durchschnittsmenschen. Die Forscher der University of Pittsburgh verweisen zudem auf Untersuchungen, die zeigen, dass KI-Gemälde bei Befragungen besser bewertet wurden als Werke von Laienmalern. Ist die KI also dabei, Menschen in allen kreativen Bereichen zu übertreffen?

Porter meint, dass dies bei längeren Texten nicht der Fall ist. «Soweit ich weiss, können grosse Sprachmodelle noch keine Romane schreiben, die nicht von menschlichen Werken zu unterscheiden sind.» Dies liege wahrscheinlich an der fehlenden Rechenleistung. Auch habe er noch keine Beweise dafür gesehen, dass eine KI ein vollständiges Comedy-Programm erstellen könne, das mit einem menschlichen mithalten kann. «Längere, von KI generierte Texte sind nach wie vor von menschlichen Texten unterscheidbar.»

dpa