Der Einfluss von KI auf menschliches Verhalten

Die Untersuchung des dynamischen Zusammenspiels zwischen KI-Technologie und menschlichem Verhalten liefert wichtige Erkenntnisse, insbesondere im Hinblick auf die Beurteilung von Kandidatinnen und Kandidaten im Recruiting. Durch die Fokussierung auf diese Schnittstelle können Organisationen ihre Bewertungsmethoden weiterentwickeln, um die tatsächlichen Eigenschaften und Potenziale von Bewerberinnen und Bewerbern präziser zu erkennen und angemessen zu berücksichtigen.

In diesem Artikel schildern wir zunächst eigene Erfahrungen mit einem vollständig KI-gestützten Interview-Tool, stellen anschließend aktuelle Forschungsergebnisse zu diesem Thema vor und schließen mit einer Argumentation für eine Schnittstelle zwischen menschlicher Informationsverarbeitung und generativer Datenverarbeitung. (c) 2026 Master Human Resources Consulting GmbH

Ziel ist es, die jeweiligen Stärken beider Ansätze zu nutzen und sich gleichzeitig der Konsequenzen bewusst zu sein, die jeder dieser Zugänge mit sich bringt.

Unsere Erfahrung:
KI-gestützte Assessment-Tools sind leicht manipulierbar

Ein Beispiel für ein KI-gestütztes Assessment-Tool im Recruiting ist ein sogenanntes One-Way-Interview, bei dem ein generatives KI-Tool (GenAI) das Interview führt und die Antworten der Kandidatinnen und Kandidaten während des Interviews bewertet. Das GenAI-Tool analysiert die Antworten und entscheidet anschließend, ob eine Person abgelehnt, angenommen oder einer „Vielleicht-Kategorie“ zugeordnet wird.

Eines der zentralen Probleme dieser Tools besteht darin, dass Kandidatinnen und Kandidaten die Ergebnisse durch sehr einfache Maßnahmen beeinflussen können:

  1. Fokus auf Audioqualität
    Eine gute Tonqualität ist entscheidend, um bei einem GenAI-Interview-Tool gute Ergebnisse zu erzielen. Kandidatinnen und Kandidaten sollten Hintergrundgeräusche vermeiden und sehr klar und präzise sprechen. Das GenAI-Interview-Tool transkribiert die Antworten zunächst, bevor es sie analysiert. Befinden sich während des Interviews andere Geräusche oder Gespräche in der Umgebung, werden die Transkriptionen unübersichtlich, was sich negativ auf die Bewertung auswirken kann. Kandidatinnen und Kandidaten mit hochwertiger Audioausstattung und ruhiger Umgebung haben dadurch einen klaren Vorteil gegenüber weniger privilegierten Personen.

  2. Kurze Antworten geben
    In klassischen Interviews ist Sprache in der Regel natürlich, also nicht vollständig flüssig, mit Pausen und Füllwörtern wie „ähm“, „hm“ usw. Dieses natürliche Sprachverhalten passt jedoch schlecht zu einem GenAI-Tool.

    Ein Beispiel: Ein GenAI-Interview-Tool führt ein Interview für eine Tätigkeit als Gerüstbauer. Die Frage des GenAI-Tools lautet etwa: „Haben Sie Angst vor Höhen?“ Die aus Sicht des GenAI-Tools korrekte und erwartete Antwort ist ein knappes „Nein“.

    In der Realität würde eine Antwort jedoch eher so klingen:
    Naja, eigentlich nicht wirklich. Aber ähm, manchmal schon, also wissen Sie, ähm. Ich war einmal auf einer Leiter, ja? Das war auf einer kleinen Baustelle. [Pause] In der Schönbrunner Strasse. Also, [Pause] da hatte jemand vergessen, den Sicherheitsgurt anzulegen. Hm, und Sie wissen ja, was das bedeutet.

    In einem echten Gespräch ist diese Antwort für einen Menschen nachvollziehbar. Wenn weitere Informationen benötigt werden, stellt die andere Person eine passende Rückfrage. Beim GenAI-Tool hingegen passiert Folgendes: Sobald die erste Pause auftritt, setzt das System das Interview fort und ignoriert den restlichen Beitrag. Die Kandidatin oder der Kandidat wird unterbrochen. Dadurch lernen Testteilnehmende sehr schnell, wie sie nicht mit dem GenAI-Tool sprechen sollten, was in weiterer Folge die Antworten systematisch verzerren kann. Personen, die ihr Verhalten gezielt an ein GenAI-basiertes Interview anpassen können, haben gegenüber anderen einen deutlichen Vorteil.

  3. Die Bewertungskriterien kennen
    Die Antworten der Kandidatinnen und Kandidaten werden vom GenAI-Tool danach bewertet, wie gut sie mit einem vordefinierten Kriterienkatalog übereinstimmen. Diese Kriterien werden dem GenAI-Modell vor dem Interview vorgegeben. Das Tool erkennt diese Kriterien in Form bestimmter Schlüsselwörter oder Wortgruppen und sucht nach Überschneidungen zwischen den Antworten der Kandidatinnen und Kandidaten und den vorab definierten Begriffen.

    Dadurch entsteht ein Vorteil für jene Personen, die exakt dieselben Begriffe verwenden, wie in der Stellenanzeige. Wenn in der Ausschreibung beispielsweise „Anpassungsfähigkeit“ und „Flexibilität“ genannt werden, erzielt eine Kandidatin oder ein Kandidat höhere Bewertungen, wenn genau diese Begriffe im Interview verwendet werden, anstatt sinngleiche Formulierungen zu wählen. Davon profitieren insbesondere Personen, die dieses System verstehen oder zufällig genau diese Wörter verwenden.

    Wenn es für Kandidatinnen und Kandidaten derart einfach ist, Vorteile zu erzielen und Ergebnisse zu manipulieren, sagt dies viel über die Zuverlässigkeit des Tools aus. Wenn eine Person bei jedem Durchlauf – in diesem Fall bei jedem Interview – unterschiedliche Ergebnisse erzielen kann, stellt sich die grundsätzliche Frage, wie solche inkonsistenten Informationen im Recruiting überhaupt sinnvoll genutzt werden können.

 

Neugierig auf die Grenzen von ChatGPT bei der Beantwortung kognitiver Tests? Hier ist der Link zum Artikel

 

Forschung:
KI-gestützte Assessment-Tools führen zu Verhaltensverzerrungen

Aktuelle Forschungsergebnisse zeigen, dass Personen, die wissen, dass sie von einem GenAI-Tool interviewt und bewertet werden, ihr Verhalten unbewusst an das anpassen, was sie für die Bewertungskriterien der KI halten. Dieses Phänomen, das häufig als „AI Assessment Effect“ bezeichnet wird, wurde in mehreren Studien zum Verhalten von Kandidatinnen und Kandidaten in Recruiting-Prozessen beobachtet. Konkret zeigt sich, dass Bewerberinnen und Bewerber dazu neigen, analytische Eigenschaften stärker hervorzuheben, während empathische und innovative Persönlichkeitsaspekte weniger gezeigt werden. Diese Verhaltensverschiebung kann grundlegend beeinflussen, wer für Positionen ausgewählt wird, und damit die Validität von Auswahlverfahren untergraben. (c) 2026 Master Human Resources Consulting GmbH

Die zugrunde liegende Ursache dieser Veränderung liegt in der weit verbreiteten Annahme, dass GenAI-Systeme analytische Merkmale stärker priorisieren als emotionale oder intuitive Eigenschaften (Goergen, de Bellis und Klesse, 2025). Diese Wahrnehmung veranlasst Kandidatinnen und Kandidaten dazu, ihre Antworten und ihr Verhalten an das anzupassen, was sie als von der KI besonders geschätzt ansehen. In der Folge kann die Authentizität der Antworten beeinträchtigt werden, was zu Auswahlentscheidungen führt, die nicht tatsächlich die beste Passung zur jeweiligen Position widerspiegeln.

In dem Bestreben, menschliche Verzerrungen im Recruiting zu reduzieren, setzen einige Organisationen zunehmend auf KI-basierte Systeme. Diese Verlagerung kann jedoch eine neue Form von Verhaltensbias erzeugen. Obwohl GenAI-Systeme auf Objektivität ausgelegt sind, deutet der „AI Assessment Effect“ darauf hin, dass sie Kandidatinnen und Kandidaten unbeabsichtigt dazu anregen können, ein verzerrtes Selbstbild zu präsentieren, indem analytische Fähigkeiten überbetont und andere relevante Merkmale wie Empathie und Kreativität vernachlässigt werden.

Gesetzliche Regelungen wie der AI Act der Europäischen Union verpflichten Organisationen dazu, den Einsatz von KI in Auswahlverfahren transparent zu machen. Diese Transparenz soll Kandidatinnen und Kandidaten über die Rolle und die Funktionsweise der KI informieren, kann jedoch gleichzeitig ihr Verhalten im Assessment beeinflussen. Das Wissen um den Einsatz von KI kann dazu führen, dass Bewerberinnen und Bewerber ihre Antworten noch stärker an vermutete KI-Präferenzen anpassen. Dies unterstreicht die Notwendigkeit einer klaren Kommunikation über die tatsächlichen Fähigkeiten und Grenzen von KI-Systemen, um potenzielle Verzerrungen durch GenAI-Assessment-Tools zu reduzieren.

Eine Studie von Fan et al. (2023) untersuchte, wie gut ein Chatbot die Persönlichkeit einer Kandidatin oder eines Kandidaten anhand eines „Dialogs“ mit einer Person bestimmen kann. Analysiert wurden die Reliabilität und Validität von durch KI abgeleiteten Persönlichkeitswerten. Die Ergebnisse zeigten, dass GenAI-basierte Persönlichkeitswerte sowohl auf Domänen- als auch auf Facettenebene des Fünf-Faktoren-Modells eine akzeptable Reliabilität aufweisen, das heißt, das Tool kann stabile und konsistente Ergebnisse liefern. Die diskriminante Validität – also die Fähigkeit, zwischen unterschiedlichen Persönlichkeitsmerkmalen zu unterscheiden – war jedoch im Vergleich zu psychometrischen Persönlichkeitstests wie der MPA - Master Person Analysis oder OPTO deutlich geringer. Dies deutet darauf hin, dass GenAI-Tools zwar bestimmte Persönlichkeitsaspekte zuverlässig erfassen können, jedoch Schwierigkeiten haben, einzelne Merkmale präzise voneinander abzugrenzen.

Die Arbeit von Fan et al. (2023) verdeutlicht damit sowohl das Potenzial als auch – und insbesondere – die zahlreichen Einschränkungen beim Einsatz von GenAI-Chatbots oder GenAI-Interview-Tools zur Persönlichkeitsdiagnostik im Recruiting. Diese Limitationen wirken sich direkt auf die prädiktive Validität der Verfahren aus, da GenAI-Interview-Tools Schwierigkeiten haben können, unterschiedliche Persönlichkeitsmerkmale korrekt zu unterscheiden. Dies kann zu Fehlklassifikationen führen, bei denen wichtige Nuancen der Persönlichkeit unberücksichtigt bleiben. So kann eine Kandidatin oder ein Kandidat beispielsweise introvertiert, zugleich aber hoch kreativ und innovativ sein. Wenn das GenAI-Tool Introversion nicht zuverlässig von anderen Merkmalen wie Offenheit für Erfahrungen unterscheiden kann, könnte die Person fälschlicherweise als ungeeignet für eine innovationsorientierte Position eingestuft werden. Aufgrund der Reliabilität des Tools ist zudem davon auszugehen, dass sich diese Einschätzung über die Zeit hinweg stabil reproduziert, sodass potenziell geeignete Kandidatinnen und Kandidaten wiederholt ausgeschlossen werden.

Dies verdeutlicht die Bedeutung einer Weiterentwicklung von GenAI-Tools, sofern sie künftig eine umfassende und valide Beurteilung der Persönlichkeit von Kandidatinnen und Kandidaten leisten sollen. Anwenderinnen und Anwender von GenAI-Lösungen im Recruiting müssen sich dieser Einschränkungen bewusst sein und diese bei der Integration von GenAI-basierten Assessments in ihre Auswahlprozesse entsprechend berücksichtigen. (c) 2026 Master Human Resources Consulting GmbH

Fazit: Ein Mittelweg

Die Diskussion über den Einsatz von GenAI-basierten Assessment-Tools im Vergleich zu traditionellen, manuell durchgeführten menschlichen Verfahren stellt diese beiden Ansätze häufig als Gegensätze dar. Tatsächlich existiert jedoch ein Mittelweg, der es ermöglicht, die Stärken beider Methoden zu nutzen und gleichzeitig ihre jeweiligen Einschränkungen zu reduzieren.(c) 2026 Master Human Resources Consulting GmbH

Datenverarbeitung

Langjährige Erfahrung in den Bereichen Datenanalyse, Machine Learning und Algorithmusentwicklung hat Organisationen wie Master International zu einer reflektierten und zurückhaltenden Haltung gegenüber den sich rasch entwickelnden Trends rund um GenAI geführt. Diese Erfahrung ermöglicht es, den Fokus auf Algorithmen und psychometrische Modelle zu legen, die sich über Jahrzehnte hinweg als zuverlässig und valide bewährt haben.

Psychometrische Verfahren, die nach etablierten Standards wie dem Test Review Model der European Federation of Psychologists’ Associations (EFPA) entwickelt und akkreditiert werden (Evers et al., 2013), bieten einen belastbaren Rahmen für die Beurteilung von Kandidatinnen und Kandidaten. Diese Verfahren sind auf Sicherheit, Zeiteffizienz und Zuverlässigkeit ausgelegt und ermöglichen einen strukturierten sowie wissenschaftlich fundierten Zugang zur Eignungsdiagnostik.

Die Implementierung psychometrischer Assessments, die anerkannten Standards entsprechen, stellt sicher, dass Unternehmen Kandidatinnen und Kandidaten auf sichere und effiziente Weise beurteilen können. Dieser Ansatz minimiert das Risiko von Verzerrungen und Fehlern, die sowohl bei rein manuellen Verfahren als auch beim Einsatz aktueller GenAI-Tools auftreten können.

Bei Master Human Resources Consulting sind wir überzeugt, dass der Einsatz psychometrischer Verfahren, die nach dem EFPA-Modell entwickelt und akkreditiert wurden, Unternehmen eine sichere, zeiteffiziente und zuverlässige Möglichkeit zur Beurteilung von Kandidatinnen und Kandidaten bietet. Gleichzeitig erlaubt uns unsere Neugier und unser innovatives Mindset, zu untersuchen, wie GenAI-Tools künftig unterstützend in bestehende Prozesse integriert werden können – nicht als Entscheidungsinstanz, sondern als ergänzendes Hilfsmittel zur Weiterentwicklung der Nutzung unserer Instrumente durch unsere Kundinnen und Kunden.


Lösung: Geprüfte, akkreditierte und auditierte psychometrische Instrumente

Wir stehen dem Einsatz von GenAI-Tools als Entscheidungsgrundlage im Recruiting kritisch gegenüber. Unterschiedliche GenAI-Lösungen können Recruiting-Prozesse unterstützen, sollten jedoch niemals die finale Entscheidungsinstanz darstellen. Auswahlverfahren müssen fair, frei von Verzerrungen und respektvoll im Umgang mit der Privatsphäre von Kandidatinnen und Kandidaten gestaltet sein.

Die psychometrischen Instrumente von Master International sind darauf ausgelegt, authentisches Verhalten zu erfassen, ohne jene Verhaltensverzerrungen zu erzeugen, die durch GenAI-basierte Assessment-Tools begünstigt werden. Dadurch werden realitätsnähere und unverfälschte Antworten von Kandidatinnen und Kandidaten ermöglicht. Die hohe Reliabilität und Validität der Master-Tools wurde und wird laufend anhand unterschiedlicher psychometrischer Gütekriterien überprüft. Sie liefern konsistente und präzise Ergebnisse und reduzieren damit das Risiko verzerrter Entscheidungsfindung.

Ein weiterer wesentlicher Vorteil der Master-Tools liegt in der Einhaltung gesetzlicher Transparenzanforderungen. Die Verfahren stellen klare Informationen über den Assessment-Prozess sowie über den Einsatz und die Rolle von GenAI bereit und entsprechen damit relevanten regulatorischen Vorgaben.

Durch die Wahl dieses Mittelwegs können Organisationen sowohl von menschlicher Einschätzung als auch von der Effizienz technischer Systeme profitieren. Dieser ausgewogene Ansatz erhöht nicht nur die Reliabilität und Validität von Assessments, sondern stellt auch sicher, dass Auswahlprozesse fair, transparent und im Einklang mit technologischen Entwicklungen sowie menschlichen Werten bleiben.

Mit dem fortschreitenden technologischen Wandel im Bereich künstlicher Intelligenz sind kontinuierliche Forschung und laufende Anpassungen unerlässlich. Dazu zählen die Weiterentwicklung von GenAI-Modellen mit dem Ziel, menschliches Verhalten besser zu verstehen und vorherzusagen, die Verbesserung von Transparenz und Nachvollziehbarkeit von GenAI-gestützten Entscheidungen sowie die fortlaufende Validierung dieser Systeme anhand etablierter psychometrischer Standards.

 

Möchten Sie mehr über unsere Instrumente erfahren? Buchen Sie jetzt ein unverbindliches Informationsgespräch

 

Literatur

Evers, A., Muñiz, J., Hagemeister, C., Høstmælingen, A., Lindley, P. & Sjöberg, A. (2013). EFPA Review Model for the Description and Evaluation of Psychological and Educational Tests. Version 4.2.6.

Fan, J., Sun, T., Liu, J., Zhao, T., Zhang, B., Chen, Z., Glorioso, M. & Hack, E. (2023). How well can an AI chatbot infer personality? Examining psychometric properties of machine-inferred personality scores. Journal of Applied Psychology, 108(8), 1277–1299. https://doi.org/10.1037/apl0001082

Goergen, J., de Bellis, E. & Klesse, A. (2025). AI assessment changes human behavior. Proceedings of the National Academy of Sciences of the United States of America, 122(25), e2425439122. https://doi.org/10.1073/pnas.2425439122

(c) 2026 Master Human Resources Consulting GmbH

Category: Publikationen +, Recruiting +, KI +
Tags: KI, Verhalten, Daten, datenbasiert, AI, GenAI

Übersetzt von: Bernhard Dworak
Datum: 16.12.2025