Direkt zum Inhalt

EvidenzUpdate: Was KI im Medizinstudium kann – und was (noch) nicht

KI ist in aller Munde – auch bei Studierenden. Die Technologie kann beispielsweise im Medizinstudium auf verschiedene Weisen unterstützen. Welche Rolle sie einnehmen sollte, bespricht diese Podcast-Folge vom EvidenzUpdate.
Zwei sitzende Medizinstudenten besprechen sich, andere laufen an ihnen vorbei, Blick von oben aus der Vogelperspektive

Non vitae sed machinae discimus?

In dieser Folge widmen wir uns einer Frage, die alle in der Lehre Tätigen interessieren könnte und die sich ob des KI-Hypes aufdrängt: Welche Rolle kann Künstliche Intelligenz in der ärztlichen Ausbildung spielen, welche Rolle soll sie spielen, welche nicht? Und: Kann Software artifizieller Intelligenz vielleicht sogar Aufgaben humaner Dozierender substituieren? Anlass für unsere Überlegungen ist ein einfach verblindeter randomisiert-kontrollierter Vergleich, den ein Autorenteam um Emma Lavigne et al. mit knapp 250 Medizinstudierenden in Montpellier und Nîmes unternommen hat.

KI im ärztlichen Alltag: Zwischen Tool und Verdacht

Für Martin Scherer sind KI-Tools eine »reflexive Parallelspur«, die zunehmend in den Lehr- und Arbeitsalltag eindringen: Man liest Hausarbeiten, Artikel, Bewerbungen – und fragt sich unweigerlich: »Wie viel ist da selbst geschrieben?« Der »große KI-Verdacht« sei ständiger Begleiter. »KI ist omnipräsent. Die Frage ist nur: Wo ist der Mensch noch drin?«

Die Studie: KI-Training verbessert OSCE-Ergebnisse

Anlass unseres Gesprächs ist eine neue französische randomisiert-kontrollierte Studie (RCT), deren Ergebnisse im NEJM AI veröffentlicht wurden. Die Autorengruppe untersucht, ob ein KI-Trainingssystem die Prüfungsergebnisse im OSCE (Objective Structured Clinical Examination) verbessern kann. Die einfache Antwort lautet: Ja, kann es.

Die Interventionsgruppe nutzte 2,5 Monate lang vor der Prüfung die GPT-4-basierte Plattform DocSimulator, auf der KI-gestützt Anamnesen und Kasuistiken mit Feedback trainiert werden konnten. Keine Multiple Choice-Fragen, sondern freier Text, echte Interaktion mit einem Chatbot, Punktzahl und Benchmarking inklusive.

Die Kontrollgruppe hatte das Standardtraining – sprich: klinische Rotationen und Übungssessions. Geprüft wurden beide Gruppen am Ende gleich – und verblindet. Das heißt, die Prüfer waren verblindet und wussten nicht, welche Studis ein AI-Training hatten, welche nicht.

Ergebnis: Die KI-Gruppe schnitt in 4 Stationen des OSCE-Parcours signifikant besser ab (Median 11,4 vs. 10,7 Punkte von jeweils maximal 20 Punkten). Und die Prüflinge waren weniger gestresst.

Mehr emotionale Sicherheit, weniger Lampenfieber

Neben dem Prüfungserfolg profitierten die mit dem KI-Tool vorbereiteten Studis emotional: Sie fühlten sich besser vorbereitet weniger gestresst und zeigten weniger Prüfungsabsentismus. Scherer interpretiert das so: »Es gibt Sicherheit in einer unsicheren Situation. Wie beim Probekonzert vor dem großen Auftritt.«

Methodik: RCT, aber nicht perfekt

Trotz randomisiertem Studiendesign kann man einiges kritisch zu hinterfragen:

  • Nur zwei Fakultäten in Frankreich → eingeschränkte Übertragbarkeit
  • Kein Zugang zu körperlicher Untersuchung oder nonverbaler Kommunikation
  • Teils uneinheitliche Baseline-Merkmale (z. B. mehr Lernende mit Vorkenntnissen in der Kontrollgruppe)
  • Keine Adjustierung der Gruppenunterschiede
  • Kein echter Langzeit-Endpunkt wie etwa: Werden daraus bessere Ärzt:innen?
  • Fazit: Hypothesengenerierend, nicht paradigmenschiebend.

  • Chancen & Risiken: Didaktische KI vs. Deskilling

    Scherer sieht das Potenzial des KI-Trainings als ergänzend, aber warnt auch vor Übernutzung: »KI darf Werkzeug sein – nicht Erzieher.«

    Die Gefahr: Deskilling, also der schleichende Verlust ärztlicher Urteilskraft durch zu viel Algorithmus-Komfort. Auch Rao et al. heben im begleitenden Editorial zum Artikel diesen Punkt hervor: »This expertise cannot be downloaded.« Und KI, so der Tenor, kann zwar Feedback geben, aber nicht Haltung, Empathie oder Ambiguitätstoleranz vermitteln.

    Hausärztliche Perspektive: KI bleibt (noch) außen vor

    Skepsis äußert Scherer mit Blick auf die hausärztliche Medizin, deren Essenz schwer digitalisierbar sei:

  • Ungeplante Kontakte
  • Vage Symptome
  • Wiederkehr und Zeitverlauf
  • Beziehung, Zuhören, Unsicherheit

  • Das alles, so Scherer sei zwar »schwer simulierbar, aber umso wichtiger.« Nößler: »Ist KI die größte Gefahr für die Hausarztmedizin?« Scherer: »Eher nicht. Aber ich bin gespannt, wie weit die Entwickler kommen.«

    »Wir müssen Lernen neu denken – aber KI erden«, wünscht sich Scherer. Das ärztliche Lernen sei mehr als Informationsverarbeitung, es sei Haltungsbildung. Und genau das -– Haltung, Urteilskraft, Empathie – lässt sich nicht einfach trainieren wie ein Multiple-Choice-Test.

    Alle Podcasts im Überblick

    Noch mehr hören? Die besten deutschsprachigen Wissens-Podcasts gibt es auf Spektrum.de. Auf dieser Seite finden Sie eine Übersicht.

    Schreiben Sie uns!

    Wenn Sie Feedback, Lob oder Kritik zu diesem Podcast haben, können Sie die Redaktion per E-Mail kontaktieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

    Partnerinhalte

    Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.