https://www.telepolis.de/features/Der-M ... 37117.html
Im Frühjahr 2025 gab es die Schlagzeile: "GPT-4.5 besteht den Turing-Test mit 73 Prozent". Die Kognitionswissenschaftler Cameron R. Jones und Benjamin K. Bergen von der University of California, San Diego (UCSD) veröffentlichten eine Studie, die sie selbst als Meilenstein bezeichneten – sich bei genauerer Betrachtung aber nur als ein Kieselstein im Schuh des gesunden Menschenverstandes herausstellte.
Man hatte wieder einen Turing-Test gemacht: Das ist ein Experiment, bei dem eine künstliche Intelligenz zeigen soll, dass sie in einem textbasierten Gespräch nicht von einem echten Menschen zu unterscheiden ist. Das Ergebnis von San Diego war: GPT-4.5 wurde in 73 Prozent der Fälle für menschlich gehalten.
Diese Quote entspricht bei Schultests einer Note von 2,5. ChatGPT-4,5 hat also bestanden.
Das Besondere an diesem Test war: Im sogenannten Drei-Parteien-Turing-Test sollten menschliche Versuchspersonen erraten, welcher von zwei Chatpartnern ein echter Mensch und welcher ein KI-System ist – und die echten Menschen wurden nur in knapp 60 Prozent aller Fälle als menschlich verdächtigt.
Das erste Ergebnis wird vom zweiten völlig desavouiert. Denn wenn ein Chatbot öfter für echt gehalten wird als ein echter Mensch, dann ist das kein technischer Durchbruch, sondern ein kultureller Offenbarungseid, kein Fortschritt, sondern ein Screenshot unserer medialen Verblödung.
Es zeigt, dass wir inzwischen so KI-sozialisiert sind, dass wir unsere eigenen Artgenossen statistisch nachweisbar nicht mehr zuverlässig erkennen. Herausgekommen war unter dem Strich also weniger, dass Maschinen wie Menschen kommunizieren können, sondern dass Menschen mittlerweile so sehr wie Maschinen ticken, dass sie den Unterschied nicht mehr beurteilen können.
Kurz gesagt: Die Maschine wird nicht menschlich. Wir werden maschinell. (...)
Die erste Gruppe bestand aus 126 UCSD-Studierenden mit einem Durchschnittsalter von rund 21 Jahren: also Menschen, die mit Memes, Emojis und Ironie sozialisiert wurden. Die zweite Gruppe, mit 158 Teilnehmenden aus dem Online-Panel Prolific, war im Schnitt 39 Jahre alt.
Die erste Gruppe waren "Digital Natives", die zweite war hybrid sozialisiert und hatte das Internet von Anfang an als Teenager miterlebt. Beide Gruppen absolvierten miteinander über 1.000 Gesprächs-Durchläufe. ChatGPT wurde personifiziert mit einer klaren Persona: jung, internetaffin, freundlich und leicht introvertiert sowie aalglatt in den Formulierungen.
Die gewählte Identität passte perfekt ins kulturelle Schema der digitalen Gegenwart: unaufdringlich, smart und affektiv neutral wie der ideale X/Twitter-Nutzer – immer anschlussfähig. Die wortwörtlich menschlichen Gesprächspartner hingegen waren anteilig nervös, suchten nach Worten oder waren widersprüchlich.
Ihr Mangel an rhetorischem Oberflächenglanz und Unschärfen im Ausdruck führte dazu, dass sie in der Publikumswertung nur Platz zwei hinter der perfekt berechneten Durchschnittsfreundlichkeit des Chatbots erreichten. Das heißt:
In San Diego hat man sich derart an maschinenkompatible Kommunikation gewöhnt, dass das Menschliche selbst wie ein Fehler wirkt, wenn nicht gar als Zumutung.
Der Faktor Mensch stört den reibungslosen Kommunikationsfluss, und der Turing-Test wurde zur Karikatur, bei dem Menschsein auf den Grad der sozialen Verträglichkeit reduziert wurde.
Der Turing-Test hat sich damit selbst entzaubert – nicht, weil die Maschine übermenschlich geworden wäre, sondern weil der Mensch sich unterkomplex präsentieren muss, um als Mensch durchzugehen. (...)
Vielleicht war der Diego-Test gar nicht als wissenschaftliches Experiment gedacht, sondern als Witz mit einem Denkzettel.
Denn wenn wir nicht endlich verstehen, wie unser Bewusstsein funktioniert, dann wird nicht die KI zur Gefahr, sondern unsere Bereitschaft, uns selbst zu reduzieren. Wer auf maschinenlesbare Klarheit konditioniert ist, hält jede Unschärfe für ein Defizit.
Wer nicht begreift, dass Bewusstsein mehr ist als korrekter Satzbau ist, bleibt blöd und merkt es nicht einmal.
Dabei ist dieses schillernde Spektrum an Irrationalität genau der Unterschied, der den Unterschied macht: Menschen lügen aus Angst, sagen die Wahrheit aus Liebe, widersprechen sich, weil sie gleichzeitig denken und fühlen.
Maschinen lügen, weil man es ihnen sagt und widersprechen nur, wenn der Prompt es befiehlt. Was uns fehlt, ist kein smarter Code, sondern der Mut zur Menschlichkeit: der Mut, unhandlich zu sein, aber lebendig.



Links:
https://arxiv.org/abs/2503.23674
https://www.heise.de/news/Chatbot-Studi ... 65123.html
https://de.wikipedia.org/wiki/Turing-Test
https://turingtest.live/
https://www.youtube.com/watch?v=6Fy-yCxNddg (Bildquelle)