Burnout: mit KI zur Diagnose

Wissen
Ausgabe
2023/22
DOI:
https://doi.org/10.4414/saez.2023.21737
Schweiz Ärzteztg. 2023;104(22):78-79

Publiziert am 31.05.2023

Innovation Burnout oder Depression? Es ist nicht immer leicht, die richtige Diagnose zu stellen. Könnte eine Künstliche Intelligenz die klinische Diagnostik unterstützen? Darauf setzt ein Forschungsteam um Mascha Kurpicz-Briki. Aber es gibt auch Skepsis.
Mascha Kurpicz-Briki, Sie sind Professorin für Data Engineering an der Berner Fachhochschule und haben zwischen 2021 und 2022 die Anfangsphase des Projekts BurnoutWords geleitet, das vom Schweizerischen Nationalfonds (SNF) unterstützt wird. Was war der Ausgangspunkt Ihrer Forschung?
Ich bin Co-Leiterin einer Forschungsgruppe für Applied Machine Intelligence, in der wir Technologie vor allem für den sozialen und den Gesundheitsbereich entwickeln. Wir arbeiten auch an der Verminderung von Verzerrungseffekten in Programmen mit Künstlicher Intelligenz (KI). Im Bereich der Burnout-Erkennung in der klinischen Psychologie zeigt die einschlägige Literatur, dass die klassische Fragebogen-Methode mit geschlossenen Fragen (Multiple Choice, Anm. d. Red.) mitunter infrage gestellt wird, obschon sie sich eigentlich bewährt hat. Auf lange Sicht sollen aus unserer Forschungsarbeit neuartige Fragebögen mit offeneren Fragen hervorgehen, mit denen sich zusätzliche Informationen gewinnen lassen.
Heisst das, die aktuellen Fragebögen sind lückenhaft?
Offene Fragen verwendet man ja bereits, etwa im Gespräch zwischen Facharzt und Patient. Aber diese zu transkribieren und systematisch auszuwerten, kostet viel Zeit. Aus diesem Grund sehen wir mit der automatischen Sprachverarbeitung (Natural Language Processing, NLP) ein grosses Potenzial in einem Bereich, in dem noch nicht alle Möglichkeiten der Digitalisierung ausgeschöpft sind.
Was ist das Neue an Ihrem Ansatz?
Es geht darum, innovative Technologien der Computerlinguistik mit bewährten Instrumenten der klinischen Psychologie zu verknüpfen. Entsprechende Vorarbeiten und erste Versuche, beispielsweise zur Erkennung von Depressionen oder Angststörungen, gibt es bereits − allerdings hauptsächlich an englischsprachigen Texten. Unsere ersten Tests sind insofern völlig neuartig, als sie sich speziell auf Burnout und auf Texte in deutscher und französischer Sprache konzentrieren.
Welche Forschungsschritte folgen als nächstes?
Dank des maschinellen Lernens konnten wir eine Gruppe von Personen mit Burnout-Verdacht eindeutig von einer Kontrollgruppe abgrenzen. Zur Validierung bereiten wir aktuell ergänzend eine vertiefende Untersuchung vor, insbesondere an Texten in deutscher und französischer Sprache. Dafür definieren wir momentan Fragen, die präzise auswertbar sind. Zudem stehen wir im Gespräch mit Partnern aus dem klinischen und dem psychotherapeutischen Bereich, um deren Bedürfnisse besser zu verstehen. Aktuell können wir ihnen zwar noch keine praxistaugliche Lösung anbieten, aber wir versuchen herauszufinden, in welcher Form ein derartiges Instrument für sie nützlich und akzeptabel wäre (siehe Kasten).

Was halten Psychiaterinnen und Psychiater davon?

«Die Studie weist meiner Meinung nach interessante Aspekte auf», sagt Prof. Erich Seifritz, Arzt an der Psychiatrischen Universitätsklinik Zürich, Mitglied im Vorstand der Schweizerischen Gesellschaft für Psychiatrie und Psychotherapie (SGPP) und Vertreter der universitären Psychiatrie. Er weist jedoch auf mehrere Punkte hin, die es noch zu optimieren gelte. Zunächst bleibe das «Grundproblem dieser Studie» das Fehlen eines Referenzstandards für die Burnout-Diagnose. «Der Burnout ist keine internistische oder psychiatrische Diagnose. Er wird derzeit anhand gängiger Skalen, insbesondere der Maslach-Skala, definiert. Die Frage ist also, nach welchem Standard die Autoren ihren Algorithmus für das maschinelle Lernen validieren.» In Ermangelung einer Standardreferenz gebe es keine Möglichkeit, «die Standard-Fragebogenmethode und den Machine-Learning-Algorithmus bezüglich ihrer Zuverlässigkeit zu vergleichen». Erich Seifritz weist auch auf Probleme bei der Dateneingabe und verarbeitung hin: «Das Projekt zeigt ja lediglich, dass Eingaben, die den Begriff ‹Burnout› enthalten, statistisch signifikant von zwei Kontrollgruppen unterscheidbar sind», einer «neutralen» Gruppe und einer anderen mit Eingaben, die den Begriff «Depression» enthalten. «Selbst wenn es sich um relevante psychiatrische Gruppierungen handeln würde, was meiner Meinung nach nicht der Fall ist, wäre die statistische Ungenauigkeit zu gross, um in einem bestimmten Fall eine psychiatrische Diagnose stellen zu können.» In Bezug auf den Output bezweifelt er, «dass der derzeitige methodische Ansatz medizinisch verwertbare Informationen liefern kann. In der Studie wurden keine Personen identifiziert, die an einem mittels standardisierter Methoden diagnostizierten Burnout-Syndrom litten. Ein allfälliger Burnout ist keine Selbstdiagnose, sondern ein psychischer oder medizinischer Befund, der von einem Arzt festgestellt werden muss.» Noch kategorischer ist Seifritz bezüglich des Nutzens eines solchen KI-basierten Diagnosetools zur ergänzenden Abklärung in Psychiatrie und Psychotherapie: «Ich halte davon gar nichts, denn in diesem Projekt stimmt schon der Begriff des Burnouts nicht. Und vor allem bezweifle ich, dass es ein zuverlässiges Instrument zur differenzialdiagnostischen Abgrenzung gegenüber der Depression darstellt.»
Wie soll dieses Instrument konkret funktionieren?
Damit soll es möglich werden, gewisse Unzulänglichkeiten der Standardfragebögen zu überwinden: Es kommt vor, dass die Patienten – eventuell aus einer defensiven oder leugnenden Haltung heraus – Falschantworten geben, die Antwortextreme oder aber Antworten wählen, die ihnen am ehesten sozial erwünscht erscheinen. Die automatische Sprachverarbeitung bietet eine Lösung, um Texte, die mithilfe von offeneren Fragen und von Gesprächen gewonnen wurden, auszuwerten und Burnout-Hinweise zu erkennen sowie zusätzliche Informationen zu anderen Syndromen zu extrahieren.
Bei Burnout kommt es vor, dass Betroffene Falschantworten geben.
© Jacqueline Day / Unsplash
Welche Schwierigkeiten sind mit der Entwicklung eines solchen Tools verbunden?
Aus ärztlicher Sicht ist es manchmal schwierig, ein Burnout von einer Depression zu unterscheiden. Wir erörtern, welche der verschiedenen Symptome in welchen Erscheinungsformen für die klinische Praxis am relevantesten sind. In Bezug auf KI arbeiten wir intensiv an den Problemen der Antwortverzerrung und der Differenzierungsunschärfen. Für diese Probleme ist die NLP eigentlich keine ideale Lösung, weil man mit dem erhobenen Datenmaterial grundsätzlich die verbreiteten Stereotypen (re)produziert. Ein weiteres Problem ergibt sich durch die Anonymisierung der Daten: Wir können so nicht überprüfen, ob alle Bevölkerungsgruppen repräsentiert sind. Da wir grosse Datenmengen benötigen, haben wir begonnen, in erweitertem Umfang klinische Daten mit Texten in französischer und deutscher Sprache zusammenzutragen. So können wir die Realität der Schweizer Gesundheitseinrichtungen besser abbilden und anschliessend Projekte in direkter Zusammenarbeit mit mehreren Partnern durchführen.
Sie weisen darauf hin, dass die KI weder eine Konsultation noch den Facharzt ersetzen wird.
Wir sind uns der Einschränkungen und inhärenten Verzerrungen dieser Technologien bewusst. Ich sehe sie daher eher als ein Instrument, das nach der Auswertung der Fragebögen Hinweise liefert, welche jedoch stets nur begleitend zum Arzt-Patienten-Gespräch betrachtet werden dürfen. Es handelt sich also um eines von mehreren diagnostischen Hilfsmitteln. Langfristig soll das uns vorschwebende Tool ergänzende Informationen zu den Resultaten herkömmlicher Fragebögen liefern. Es geht schlichtweg darum, über eine «erweiterte Intelligenz» zu verfügen, ein zusätzliches Instrument, das die Fachärzte bei ihrer täglichen Arbeit unterstützt. Im Zentrum muss weiterhin der Mensch stehen.
Sind Tools dieser Art auch für andere Fachgebiete denkbar?
Ja, ich bin zuversichtlich, dass solche Methoden auch in der psychiatrischen Diagnostik und in der Psychotherapie eingesetzt werden könnten. Überall dort, wo das gesprochene und das geschriebene Wort eine wichtige Rolle spielen.
Prof. Dr. Mascha Kurpicz-Briki
Professorin für Data Engineering an der Berner Fachhochschule (BFH)