Bias-Checkliste für Beurteilungen: Vier Fragen, bevor Sie die Note setzen

Praxisanleiterin in blauer Pflegeuniform sitzt nachdenklich an einem Schreibtisch und füllt einen Beurteilungsbogen aus, neben ihr liegt ein Tablet.

Der Bewertungsbogen liegt auf dem Tisch. Leon hat die Rotation abgeschlossen. Sie überlegen kurz – und beginnen dann relativ zügig, die Felder auszufüllen. Das Ergebnis: durchgehend gut bis sehr gut. Passt das? Wahrscheinlich schon. Aber woher wissen Sie das wirklich?

Montag haben wir die sieben häufigsten Verzerrungsmechanismen in der Praxisanleitung betrachtet – von Sympathiefehlern über den Halo-Effekt bis zum Milde-Fehler. Heute geht es um den nächsten Schritt: wie Sie diese Mechanismen konkret unterbrechen, unmittelbar bevor eine Beurteilung feststeht. Nicht mit Willenskraft. Mit vier gezielten Fragen an eine KI.

Warum Vorsätze allein nicht reichen

Kognitive Verzerrungen entstehen fast ausschließlich im schnellen, automatischen Denken – dem Modus, der nach einer anstrengenden Schicht die Führung übernimmt. Wer dann einen Beurteilungsbogen ausfüllt, bewertet weniger Kompetenz als Erinnerungsreste, erste Eindrücke und interpersonelle Sympathie. Das ist keine Charakterschwäche. Das ist Physiologie.

Das Problem mit klassischen Awareness-Ansätzen – Fortbildungen über Bias, Merkzettel am Schreibtisch – liegt im Timing. Wissen über Verzerrungen, das Wochen vor der Beurteilung vermittelt wurde, ist im entscheidenden Moment kaum abrufbar. Die Forschung ist hier eindeutig: Wirkungsvolle Interventionen passieren genau dann, wenn die Entscheidung noch offen ist. Nicht danach.

Ein präzise formulierter KI-Prompt, der fünf Minuten vor dem Ausfüllen eines Beurteilungsbogens eingesetzt wird, funktioniert als kognitiver Störer. Er zwingt das Gehirn in einen kurzen Perspektivwechsel – lang genug, um typische Verzerrungsreflexe zu unterbrechen.

Der Prompt – zum Kopieren

Bevor Sie den Prompt einsetzen, ein Hinweis, den Sie ernst nehmen sollten: Geben Sie keine echten Namen, keine Einrichtungsbezeichnungen und keine identifizierbaren Situationsdetails in ein cloudbasiertes KI-Tool ein. Ausbildungsdaten sind personenbezogene Daten im Sinne der DSGVO – und kommerzielle KI-Dienste wie ChatGPT oder Claude speichern Eingaben möglicherweise für Trainingszwecke oder Drittanbieter.

Was das konkret bedeutet: Arbeiten Sie im Prompt mit Platzhaltern statt mit echten Namen, mit allgemeinen Situationsbeschreibungen statt mit identifizierbaren Details, und mit Ausbildungsjahr und Einsatzbereich statt mit Stationsbezeichnungen.

Wer auf Nummer sicher gehen möchte, kann ein lokal betriebenes Sprachmodell einsetzen – also ein LLM, das ausschließlich auf dem eigenen Gerät oder dem einrichtungsinternen Server läuft und keine Daten nach außen sendet. Lösungen wie Ollama mit einem Llama- oder Mistral-Modell sind kostenlos verfügbar. Der Nachteil: Die Antwortqualität ist spürbar geringer als bei den großen Cloud-Modellen, die Einrichtung erfordert technisches Grundwissen, und auf mobilen Dienstgeräten ist eine lokale Installation meist nicht möglich. Für viele Praxisanleitende ist der anonymisierte Cloud-Prompt der pragmatischere Weg – solange keine identifizierbaren Daten verwendet werden.

Ich bin Praxisanleiter:in in der Pflegeausbildung und stehe kurz vor 
einer Leistungseinschätzung.

Auszubildende:r: [Kürzel oder Beschreibung – KEIN echter Name. 
z.B. „Az-M, 2. Ausbildungsjahr, stationäre Altenpflege"]

Meine aktuelle Gesamteinschätzung: [kurze Beschreibung – z.B. 
„gut bis sehr gut, kommunikativ stark, Dokumentation noch unsicher"]

Stelle mir jetzt genau 4 Prüffragen – je eine zu diesen Perspektiven:

1. Suche aktiv nach Evidenz, die GEGEN meine Einschätzung spricht. 
   Ich soll Situationen benennen, nicht Meinungen.
2. Lass mein Urteil durch die Augen einer dritten Person betrachten 
   (z.B. Kolleg:in der Nachtschicht, Patient, Stationsleitung).
3. Prüfe, ob ein einzelnes starkes Merkmal alle anderen Dimensionen 
   überstrahlt.
4. Frage nach dem Zeitraum: Aus welcher Woche der Rotation stammen 
   meine prägenden Beobachtungen?

Wichtig: Beantworte die Fragen nicht. Stelle sie nur – 
präzise, kurz, direkt. Keine Einleitung, kein Kommentar.

Ein Beispiel aus dem Pflegealltag

Tobias begleitet Leon über vier Wochen im stationären Bereich. Leon ist kommunikativ stark, bei Patienten und Team beliebt. In der Pflegedokumentation läuft es holpriger: Eintragungen fehlen, Priorisierungen sind manchmal unklar.

Tobias füllt die Platzhalter aus – mit Kürzel statt echtem Namen, ohne Stationsbezeichnung – und gibt den Prompt ein. Das Ergebnis der KI:

Frage 1 (Gegenevidenz): Welche drei konkreten Situationen aus den letzten vier Wochen könnte eine Stationsleitung anführen, um zu begründen, dass die Leistung des Auszubildenden insgesamt nur befriedigend war?

Frage 2 (Dritte Perspektive): Was hätte die Kollegin der Nachtschicht, die den Auszubildenden nie bei der Übergabe erlebt hat, an seinem Dokumentationsverhalten möglicherweise kritisiert – ohne den Gesamteindruck der Zusammenarbeit zu kennen?

Frage 3 (Halo-Check): Sie beschreiben den Auszubildenden als kommunikativ stark und zuverlässig. Wie würden Sie seine pflegerischen Kernkompetenzen – Pflegediagnostik, Priorisierung, Dokumentation – beurteilen, wenn Sie die interpersonellen Qualitäten gedanklich ausblenden?

Frage 4 (Zeitraum-Check): Aus welcher Woche der Rotation stammen die Beobachtungen, die Ihre Einschätzung im Wesentlichen prägen – und was hat sich in den anderen Wochen konkret getan?

Tobias beantwortet die Fragen schriftlich, kurz. Bei Frage 3 merkt er: Die Dokumentationsmängel hat er bisher wegerklärt, weil der Gesamteindruck so positiv war. Die Note ändert sich nicht grundlegend – aber das Feedback, das Leon erhält, wird präziser und damit ehrlicher.

Was Praxisanleitende damit machen können

Die KI stellt die Fragen – Sie beantworten sie. Das dauert keine zehn Minuten. Das Ergebnis ist keine neue Beurteilung. Es ist eine überprüfte Beurteilung.

Wichtig: Schreiben Sie die Antworten auf, zumindest stichpunktartig. Was nur im Kopf bleibt, wird von System 1 sofort weggenickt. Was auf Papier steht, muss standhalten. Das ist der eigentliche Effekt des Prompts – nicht die KI-Ausgabe, sondern Ihr eigener Text.

Die Grenze bleibt klar: KI liefert Perspektivwechsel. Die Beurteilung liegt bei Ihnen.

Wo die Methode besonders gut funktioniert

Der Prompt entfaltet seine Wirkung dort, wo eine Einschätzung bereits feststeht, bevor sie schriftlich fixiert ist – also kurz vor dem Ausfüllen eines Bogens oder vor einem formellen Feedbackgespräch. Er passt besonders dann, wenn Sie einen Auszubildenden über mehrere Wochen intensiv begleitet haben und eine arbeitsbeziehungliche Nähe entstanden ist. Und er hilft in Situationen, in denen ein Merkmal – positiv wie negativ – besonders im Gedächtnis haftet.

Worauf Sie bei den Ergebnissen achten sollten

Wenn Ihnen bei Frage 1 keine konkreten Situationen einfallen, die gegen Ihre Einschätzung sprechen: Das ist ein Ergebnis. Entweder Sie haben wirklich sorgfältig beobachtet – oder der Bestätigungsfehler hat bereits gefiltert. Den Unterschied erkennen Sie nur, wenn Sie aktiv suchen.

Wenn die KI-Fragen generisch wirken und auf jede Situation passen könnten, liegt es fast immer an den Platzhaltern. Je konkreter Ihre Eingabe, desto schärfer die Prüffragen. „Azubi, 2. Jahr, gute Leistung“ erzeugt andere Fragen als „Az-M, 2. Ausbildungsjahr, kommunikativ stark, Dokumentation lückenhaft, letzter Monat im stationären Bereich“.

Typische Fehler

Zu allgemeine Platzhalter sind der häufigste Grund, warum der Prompt nicht liefert. Zwei Minuten Präzision in der Eingabe entscheiden über die Qualität der Reflexion.

Der zweite Fehler ist subtiler: Die Fragen nach dem Lesen sofort mental abhaken. Das ist das schnelle Denken, das sich verteidigt. Wer die Antworten aufschreibt, macht das Urteil sichtbar – und damit überprüfbar.

🛠 Praxistipp der Woche

Öffnen Sie diesen Prompt das nächste Mal fünf Minuten, bevor Sie einen Beurteilungsbogen ausfüllen – nicht danach. Der Unterschied liegt nicht in der Methode. Er liegt im Zeitpunkt. Vor der Note ist das Urteil noch formbar. Danach sucht das Gehirn nur noch nach Bestätigung.

Beurteilungen werden nicht besser, indem man sich mehr Mühe gibt. Sie werden besser, indem man die richtigen Fragen stellt – bevor man entschieden hat.