So gut KI-Chatbots bei vielen Aufgaben abschneiden, so durchwachsen war das Ergebnis eines Leistungsvergleichs im Hinblick auf das historische Wissen und Verständnis, den ein Forscherteam unter Beteiligung des Wiener Complexity Science Hub (CSH) durchgeführt hat. Am besten unter sieben getesteten Modellen schnitt noch GPT-4 Turbo ab.