Keine gesunden Schulen ohne gesunde Lehrkräfte: Was über die Umsetzung von Programmen zur Lehrkräftegesundheit bekannt ist

Eine Schule erhält Mittel für ein Programm gegen Lehrkräfte-Stress. Es ist wissenschaftlich erprobt, das Kollegium ist anfangs aufgeschlossen, und doch nutzt es ein Jahr später kaum noch jemand. Solche Verläufe sind kein Einzelfall, und sie haben selten mit dem Programm selbst zu tun.

Für die psychische Gesundheit von Lehrkräften gibt es inzwischen eine Reihe wirksamer Programme: Achtsamkeitstrainings, Stressbewältigung, verhaltensbezogene Ansätze. weisen ihre Effekte nach. Weit weniger ist darüber bekannt, ob und wie diese Programme im Schulalltag tatsächlich ankommen. Genau diese Lücke nimmt ein aktuelles von Sterr und Kollegen an der Technischen Universität München in den Blick (Sterr et al., 2026). Die Befunde sind ernüchternd und zugleich lehrreich: Die Forschung weiß gut, was wirkt. Wie diese Wirkung in eine bestimmte Schule gelangt, also das Wie der Umsetzung, bleibt überwiegend im Dunkeln. Der folgende Beitrag fasst die Studie zusammen und ordnet sie für die Präventionspraxis ein.

Warum die Gesundheit von Lehrkräften ein Public-Health-Thema ist

Die Belastung von Lehrkräften ist gut dokumentiert. Emotionale Erschöpfung und Burnout sind verbreitet, gehen mit geringerer Arbeitszufriedenheit, schlechterem Schlaf und höherer Berufsausstiegsneigung einher. Für Deutschland berichtet das Review erhöhte Raten sowohl von krankheitsbedingtem als auch von Absentismus; drei von vier Lehrkräften treten früher in den Ruhestand als rechtlich vorgesehen, was den ohnehin bestehenden Personalmangel weiter verschärft (Sterr et al., 2026).

Die Gesundheit von Lehrkräften ist dabei nicht allein ihre persönliche Angelegenheit. Sie prägt die Qualität des Unterrichts und damit die Entwicklung der Schülerschaft. Eine groß angelegte Untersuchung an 1.102 deutschen Grundschullehrkräften und rund 22.000 ihrer Viertklässler zeigte, dass die emotionale Erschöpfung der Lehrkraft negativ mit der Mathematikleistung zusammenhängt, und zwar auch nach Kontrolle zahlreicher Lehrkraft- und Schülermerkmale, darunter Berufserfahrung, Lehramtsqualifikation und Familiensprache. Besonders ausgeprägt war der Zusammenhang in Klassen mit hohem Anteil an Kindern mit nicht-deutscher Familiensprache (Klusmann, Richter & Lüdtke, 2016). Der Effekt ist statistisch gesichert, aber klein: Eine um eine Standardabweichung höhere Erschöpfung ging im Mittel mit gut viereinhalb Punkten geringerer Klassenleistung im Mathematiktest einher. Lehrkräftegesundheit ist damit eine Stellschraube für Bildungsqualität und Bildungsgerechtigkeit zugleich, wenn auch eine unter mehreren.

Wie wirksam Gegenmaßnahmen sein können, zeigt eine systematische Übersicht mit Metaanalysen: Für psychologische Programme fand sie in randomisierten kontrollierten Studien große Effekte auf Stress (Hedges' g = 0,93) und mittlere Effekte auf Angst (g = 0,65), Depression (g = 0,51), Burnout (g = 0,57) und Wohlbefinden (g = 0,56); in nicht-randomisierten Designs fielen die Effekte schwächer aus (Beames et al., 2023). Eine separate Metaanalyse zu Programmen gegen Lehrkräfte-Burnout kommt zu vergleichbar moderaten Effekten (Iancu et al., 2018). Dieselbe Übersicht von Beames und Kollegen weist allerdings auf einen folgenreichen Vorbehalt hin: Viele dieser Programme verlangen erheblich Zeit und Ressourcen und lassen sich aus der Studiensituation oft nicht in den zeitknappen Schulalltag übertragen. Als Ausweg empfehlen die Autoren, Programme gemeinsam mit Lehrkräften zu entwickeln und ressourcenschonender anzubieten, etwa zeitlich flexibel und online. Damit ist die zentrale Frage gestellt, der das Review von Sterr et al. nachgeht.

Wo es um die Belastungs- und Schutzfaktoren selbst geht, lohnt der Blick in den ergänzenden FINDER-Beitrag Lehrergesundheit im Fokus. Der vorliegende Text betrachtet die andere Seite: nicht was belastet oder schützt, sondern wie Programme in die Praxis gelangen.

Was die Studie untersucht hat

Sterr et al. (2026) legen ein Scoping Review vor, also eine strukturierte Bestandsaufnahme der vorhandenen Literatur, die das Feld kartiert, statt eine einzelne Wirkungsfrage statistisch zu bündeln. Methodisch folgt die Arbeit den etablierten Rahmen von Arksey und O'Malley sowie Levac und Kollegen und berichtet nach dem PRISMA-ScR-Standard. Durchsucht wurden die Datenbanken Scopus und EBSCOhost bis April 2025. Von 4.062 Datensätzen nach Dublettenbereinigung erfüllten am Ende 16 Studien die Einschlusskriterien. Sie erschienen zwischen 1984 und 2025, zwölf davon nach 2020, und stammen überwiegend aus dem Vereinigten Königreich, den USA und Australien, ergänzt um Studien aus den Niederlanden, Deutschland, Schweden, Portugal, Ecuador, dem Iran und Israel. Das Spektrum reichte von randomisierten kontrollierten Studien (sieben von 16) über nicht-randomisierte und quasi-experimentelle Designs bis zu einfachen Vorher-Nachher-Erhebungen; fünf waren als Machbarkeits- oder Pilotstudien angelegt.

Um die heterogenen Beschreibungen vergleichbar zu machen, kodierte das Forschungsteam jede Studie entlang dreier anerkannter Rahmenwerke der , also jener Disziplin, die untersucht, wie wissenschaftlich belegte Maßnahmen zuverlässig in die Routinepraxis überführt werden:

CFIR (Consolidated Framework for Implementation Research) für die Determinanten, also die Kontextfaktoren, die eine Umsetzung erleichtern oder erschweren (Damschroder et al., 2009).
SISTER (School Implementation Strategies, Translating ERIC Resources) für die Strategien, also die gezielten Vorgehensweisen, mit denen eine Umsetzung gestützt wird (Cook et al., 2019).
IOF (Implementation Outcomes Framework) für die Ergebnisse der Umsetzung, etwa Akzeptanz, Machbarkeit oder Nachhaltigkeit, abzugrenzen von den eigentlichen Gesundheitswirkungen (Proctor et al., 2011).

Wie sich Umsetzungsprozesse darüber hinaus mit eigenen Methoden sichtbar machen lassen, zeigt der Beitrag Soziale Netzwerkanalyse in der Präventionsumsetzung.

Zentrale Befunde

Die folgende Übersicht bündelt, was die 16 Studien entlang der drei Umsetzungsdimensionen am häufigsten zeigen; die Abschnitte danach erläutern die Befunde.

Umsetzungsdimension	Häufigste Befunde (von 16 Studien)
Determinanten · CFIR (fördernde und hemmende Kontextfaktoren)	Zeitknappheit (10×) und Arbeitspensum (5×) als größte Hürden; die meisten Faktoren auf der individuellen Ebene
Strategien · SISTER (umsetzungsstützende Vorgehensweisen)	Schulung und Befähigung (13), Anpassung an den Kontext (8), kollegiale Beziehungen (6)
Ergebnisse · IOF (gemessene Umsetzungsqualität)	Akzeptanz (11 von 14) und Machbarkeit (8 von 14); langfristige Verstetigung kaum erfasst

Der Blick aufs Was, selten aufs Wie

Die meisten Studien waren wirkungsorientiert und untersuchten frühe Umsetzungsphasen, kaum die dauerhafte Verankerung. Nur sieben der 16 Studien widmeten sich Wirksamkeit und Umsetzung gleichgewichtig; fünf konzentrierten sich auf die Wirkung und behandelten die Umsetzung nebenbei, vier waren reine Umsetzungs- oder Prozessevaluationen. Implementationsaspekte wurden überwiegend im Nachhinein berichtet, selten vorab geplant und systematisch erhoben. Nur zwei der 16 Studien benannten ihre Umsetzungsstrategien ausdrücklich als solche, und zehn von 16 stützten sich auf gar kein Implementations-Rahmenwerk. Auffällig auch: Nur sieben Studien prüften überhaupt formal, wie Umsetzung und Wirksamkeit zusammenhängen, obwohl gerade dieser Zusammenhang erklärt, warum ein Programm im Alltag wirkt oder eben nicht. Die Folge ist eine uneinheitliche Begrifflichkeit, die einen Vergleich erschwert. Genau hier liegt der Beitrag der Übersicht: Sie übersetzt verstreute, vage Beschreibungen in eine gemeinsame Sprache.

Determinanten: Zeit und Arbeitspensum als größte Hürden

Fast alle Studien (15 von 16) berichteten Kontextfaktoren der Umsetzung, allerdings meist post hoc; nur vier erhoben auch vorab erwartete Hürden oder Ressourcen. Insgesamt ließen sich 18 verschiedene Determinanten identifizieren. Am häufigsten genannt wurden Zeitknappheit (zehnmal) und Arbeitspensum (fünfmal), beide dem Inner Setting, also den schulinternen Bedingungen, zugeordnet. Die meisten Determinanten betrafen die individuelle Ebene der Lehrkräfte, etwa Bedenken zu Vertraulichkeit, Stigmatisierung oder Veränderungsbereitschaft.

Bemerkenswert ist die Doppelnatur zweier Faktoren: Das Engagement der Beteiligten und die Unterstützung durch die Schulleitung wirkten als Hürde, wenn sie fehlten (sechsmal als Barriere genannt), und als Ressource, wenn sie vorhanden waren (achtmal als Förderfaktor). Umsetzung gelingt also nicht im luftleeren Raum, sondern hängt an konkreten organisatorischen und personellen Bedingungen.

Strategien: Schulung, Kontextanpassung, kollegiale Beziehungen

Auch wenn kaum eine Studie ihre Strategien explizit benannte, ließ sich nahezu überall eine umsetzungsstützende Aktivität rekonstruieren. In der SISTER-Systematik dominierten drei Bereiche: Schulung und Befähigung der Beteiligten (Train and Educate Stakeholders, 13 von 16 Studien), Anpassung an den lokalen Kontext (Adapt and Tailor to Context, 8 von 16) sowie die Stärkung von Beziehungen im Kollegium (Develop Stakeholder Interrelationships, 6 von 16). Hinzu kamen interaktive Rückmeldung (ebenfalls 6 von 16) und seltener evaluativ-iterative Vorgehensweisen.

Eine Studie illustrierte besonders deutlich, dass Befähigung Zeit braucht: Erst eine zweijährige statt einjährige Begleitung versetzte Lehrkräfte in die Lage, die Intervention wie vorgesehen umzusetzen.

Ergebnisse der Umsetzung: meist nur Akzeptanz und Machbarkeit

14 der 16 Studien berichteten Umsetzungsergebnisse, doch nur wenige stützten sich dabei auf ein etabliertes Rahmenwerk: lediglich drei nutzten ein eigenes Rahmenwerk für Umsetzungsergebnisse. Mit Abstand am häufigsten erfasst wurden Akzeptanz (in 11 von 14 Fällen) und Machbarkeit (8 von 14), gefolgt von Passung, Treue zur geplanten Umsetzung und Übernahme. Aufschlussreichere, beobachtbare Ergebnisse wie die tatsächliche Verbreitung in einer Einrichtung oder die langfristige Verstetigung wurden kaum untersucht. Damit beruht das Wissen über die Umsetzung zu großen Teilen auf der subjektiven Einschätzung der Beteiligten, nicht auf belegtem Umsetzungsverhalten.

Auffällig ist schließlich ein Ungleichgewicht der Ansatzebenen: Neun der 16 Interventionen setzten an der individuellen Ebene an (etwa Achtsamkeit oder Stressmanagement), nur fünf an organisationalen, also strukturellen Bedingungen der Schule.

Drei Lehren für die Praxis

Aus der Diskussion des Reviews lassen sich drei praxisnahe Einsichten ableiten, jeweils an konkreten Studien festgemacht.

Akzeptanz allein genügt nicht. Das Programm WISE wurde im Pilot als gut akzeptabel und machbar bewertet. In der Hauptstudie berichteten Lehrkräfte jedoch, dass es die tieferliegenden, systemischen Ursachen ihrer Belastung nicht adressierte. In der Folge sank die Akzeptanz, und die Umsetzung blieb gering. Eine hohe anfängliche Zustimmung sagt also wenig darüber aus, ob ein Programm den eigentlichen Bedarf trifft. Für die Praxis heißt das, vor der Programmauswahl den tatsächlichen Bedarf und die strukturellen Belastungen vor Ort zu erheben, statt auf erste Begeisterung zu setzen. Wie hartnäckig sich vertraute, aber unwirksame Angebote halten, zeigt der Beitrag Warum Schulen an ineffektiven Präventionsprogrammen festhalten.

Strukturelle Veränderung wirkt verzögert. Eine organisationale Intervention in den Niederlanden verbesserte mehrere systemische Bedingungen, insbesondere die Qualität der Führung, brachte aber kurzfristig keine messbare Senkung der emotionalen Erschöpfung. Veränderungen an strukturellen Wurzeln schaffen die Voraussetzungen für Verbesserung, brauchen für sichtbare Gesundheitseffekte aber längere Zeiträume. Für die Bewertung folgt daraus, organisationale Veränderungen nicht allein an kurzfristigen Gesundheitsdaten zu messen, sondern Zwischenschritte wie eine verbesserte Führungs- und Kooperationskultur als eigene Erfolgsmarken einzuplanen.

Mehr Strategien sind nicht automatisch besser. Die einzige Studie, die Umsetzungsstrategien experimentell verglich, stellte eine einzelne Schulungsstrategie einem mehrteiligen Strategiebündel gegenüber (Toropova et al. im Review). Das Bündel brachte für den Umsetzungserfolg keinen Mehrwert. Entscheidend ist nicht die Menge der Maßnahmen, sondern ihre Passung zu den vorab ermittelten Bedingungen vor Ort, gemeinsam mit den Beteiligten geplant. Praktisch bedeutet das, wenige, zur Schule passende Strategien gemeinsam mit dem Kollegium auszuwählen, statt ein möglichst großes Maßnahmenpaket einzuführen.

Jenseits dieser drei Warnungen zeichnet das Review auch ein positives Muster: Wirksame Umsetzungen ruhen auf drei Säulen: der Befähigung der Beteiligten, die ein Programm umsetzen, der Anpassung an den konkreten Kontext und der Stärkung der Beziehungen im Kollegium. Wie stark jede dieser Säulen wirkt, hängt jedoch von der einzelnen Schule ab.

Einordnung

Die Aussagekraft des Reviews hat Grenzen, die die Autoren offenlegen. Die uneinheitliche und oft vage Berichterstattung der Originalstudien machte die Zuordnung zu den Rahmenwerken anspruchsvoll und teils interpretativ. Die Datenextraktion lag primär bei einer Person, abgesichert durch wiederholte Abstimmung im Team. Und die kleine, heterogene Studienzahl erlaubt keine verallgemeinernden Wirkaussagen, sondern eine Kartierung des Forschungsstands. Als Scoping Review ist genau das ihr Anspruch.

Für die Präventionspraxis liegt der Wert der Arbeit gerade in dieser Kartierung. Sie macht sichtbar, dass das Wie der Umsetzung das Bindeglied zwischen Forschung und Schulalltag ist: Ein wissenschaftlich erprobtes Programm entfaltet keine Wirkung, wenn es nicht zu den Bedingungen, dem Zeitbudget und den Beziehungen einer Schule passt. Diese Passung ist keine Einzelentscheidung einer Lehrkraft, sondern eine Frage der Schulentwicklung und der gemeinsamen Trägerschaft im Setting. Dieselbe Lücke zwischen erprobter Wirkung und gelingender Umsetzung zeigt sich nicht nur in der Schule, sondern ebenso in Kommune und Jugendhilfe, wo Maßnahmen von kollektiven Entscheidungsstrukturen abhängen. Wie dauerhaft sich Innovationen überhaupt verankern lassen, vertieft der Beitrag Nachhaltigkeit von Innovationen in Prävention und Gesundheitsförderung.

Fazit

Der Titel des Reviews ist Programm: keine gesunden Schulen ohne gesunde Lehrkräfte. Damit Programme dieses Ziel erreichen, reicht es nicht, auf belegte Inhalte zu setzen. Ebenso wichtig ist, wie sie umgesetzt werden, und ob sie organisationale und individuelle Ebene zugleich in den Blick nehmen. Künftige Forschung sollte Implementation systematisch und mit einheitlicher Sprache planen, beobachtbare Umsetzungsergebnisse erheben und die langfristige Verankerung untersuchen. Für die Praxis gilt der Doppelfokus auf Inhalt und Umsetzung: Erst wenn ein evidenzbasiertes Programm zu den realen Bedingungen einer Schule passt, kann es Lehrkräften und damit der ganzen Schulgemeinschaft zugutekommen.

Literaturverzeichnis

Beames, J. R., Spanos, S., Roberts, A., McGillivray, L., Li, S., Newby, J. M., et al. (2023). Intervention programs targeting the mental health, professional burnout, and/or wellbeing of school teachers: Systematic review and meta-analyses. Educational Psychology Review, 35(1), 26. https://doi.org/10.1007/s10648-023-09720-w

Cook, C. R., Lyon, A. R., Locke, J., Waltz, T., & Powell, B. J. (2019). Adapting a compilation of implementation strategies to advance school-based implementation research and practice. Prevention Science, 20(6), 914–935. https://doi.org/10.1007/s11121-019-01017-1

Damschroder, L. J., Aron, D. C., Keith, R. E., Kirsh, S. R., Alexander, J. A., & Lowery, J. C. (2009). Fostering implementation of health services research findings into practice: A consolidated framework for advancing implementation science. Implementation Science, 4, 50. https://doi.org/10.1186/1748-5908-4-50

Iancu, A. E., Rusu, A., Măroiu, C., Păcurar, R., & Maricuțoiu, L. P. (2018). The effectiveness of interventions aimed at reducing teacher burnout: A meta-analysis. Educational Psychology Review, 30(2), 373–396. https://doi.org/10.1007/s10648-017-9420-8

Klusmann, U., Richter, D., & Lüdtke, O. (2016). Teachers' emotional exhaustion is negatively related to students' achievement: Evidence from a large-scale assessment study. Journal of Educational Psychology, 108(8), 1193–1203. https://doi.org/10.1037/edu0000125

Proctor, E., Silmere, H., Raghavan, R., Hovmand, P., Aarons, G., Bunger, A., et al. (2011). Outcomes for implementation research: Conceptual distinctions, measurement challenges, and a research agenda. Administration and Policy in Mental Health and Mental Health Services Research, 38(2), 65–76. https://doi.org/10.1007/s10488-010-0319-7

Sterr, K., Bachner, J., Scheller, D. A., Mess, F., Blaschke, S., Mühlberg, T., Butscher, F., & Schmid-Ellinger, J. (2026). No healthy schools without healthy teachers: A scoping review on implementation determinants, strategies and outcomes of mental health-promoting interventions for school teachers. BMC Public Health, 26(1), 710. https://doi.org/10.1186/s12889-026-26589-w

Hinweis: Die im Text genannten Einzelstudien (etwa zu WISE oder zum Strategievergleich) werden im Scoping Review von Sterr et al. (2026) im Detail zitiert und können dort nachgeschlagen werden.