Dieser Beitrag basiert auf: Lemberger-Truelove, M. E., Li, D., Kim, H., Hill, D. D., Dickson, R. & Kang, Z. (2026). School mental health interventions for adolescents: A meta-analysis of effectiveness and relevant moderators. Adolescents, 6(1), 6. https://doi.org/10.3390/adolescents6010006

Einleitung

Im Dezember 2025 haben wir an dieser Stelle einen unbequemen Befund diskutiert: Schulbasierte Programme zur Förderung psychischer Gesundheit (engl. mental health programs) können unter bestimmten Umständen mehr schaden als nutzen. Das Scoping Review von Guzman-Holst et al. (2025) und die britische AWARE-Studie (Department for Education, 2025) zeigten, dass negative Effekte keineswegs eine Randerscheinung sind – und dass gerade methodisch hochwertige Studien diese häufiger nachweisen.

Nun liegt eine neue Metaanalyse vor, die diese Diskussion um eine wichtige Facette erweitert. Lemberger-Truelove et al. (2026) haben 18 randomisierte kontrollierte Studien zur Wirksamkeit schulbasierter Interventionen zur psychischen Gesundheit für Jugendliche synthetisiert. Auf den ersten Blick liefert die Studie eine beruhigende Nachricht: Schulbasierte Interventionen wirken. Auf den zweiten Blick zeigt sich jedoch, dass die Befunde die Kernaussagen unseres früheren Beitrags in wesentlichen Punkten stützen und vertiefen – manchmal auf überraschende Weise. Und sie werfen eine grundlegendere Frage auf: ob das gesamte Feld nicht den falschen Hebel ansetzt.

Ja, schulbasierte Interventionen wirken – aber wie stark?

Die zentrale Erkenntnis zuerst: Über alle 18 Studien hinweg fanden Lemberger-Truelove et al. (2026) einen statistisch signifikanten positiven Gesamteffekt von Hedges‘ g = 0,068. Hedges‘ g ist ein standardisiertes Maß dafür, wie stark sich zwei Gruppen – hier: Interventions- und Kontrollgruppe – in ihren Ergebnissen unterscheiden. Ein Wert von 0 bedeutet kein Unterschied; Werte um 0,2 gelten als kleiner, um 0,5 als mittlerer und ab 0,8 als großer Effekt. Ein g von 0,068 sagt also: Im Durchschnitt geht es Jugendlichen, die an schulbasierten Interventionen teilnehmen, danach etwas besser als jenen in Kontrollgruppen – in akademischer, sozialer, emotionaler und psychischer Hinsicht. Der Unterschied ist messbar, aber gering.

Um diesen Wert einzuordnen: Frühere Metaanalysen berichteten für vergleichbare Interventionen Effektstärken von 0,17 bis 0,39 (Cai et al., 2025; Sanchez et al., 2018; Zhang et al., 2023; jeweils zitiert nach Lemberger-Truelove et al., 2026). Der aktuelle Befund fällt an das untere Ende dieses Spektrums.

Bedeutet das, dass schulbasierte Prävention nicht lohnt? Keineswegs – und hier ist die richtige Einordnung entscheidend. Wie Lemberger-Truelove et al. (2026) betonen, können selbst kleine Effektstärken auf Bevölkerungsebene einen erheblichen Unterschied machen, wenn Interventionen eine große Zahl von Jugendlichen erreichen. Nur etwa 20 % der Jugendlichen mit diagnostizierbaren psychischen Störungen erhalten eine angemessene Behandlung (Whitney & Peterson, 2019, zitiert nach Lemberger-Truelove et al., 2026). Schulbasierte Programme erfüllen daher eine wichtige Brückenfunktion: Sie erreichen Jugendliche, die sonst gar keinen Zugang zu Unterstützung hätten.

Das ist das klassische und im Kern überzeugende Argument für universelle Prävention. Kleine Effekte nimmt man bewusst in Kauf, weil die Reichweite den geringen individuellen Nutzen kompensiert. Man kann die kleinen Effekte freilich auch anders lesen: als Hinweis darauf, dass die Vermittlung psychologischer Inhalte an Individuen nur begrenzt wirken kann, wenn die Bedingungen, die Belastung erzeugen, unverändert bleiben. Doch dieses Argument hat eine Kehrseite, die im Licht unseres Dezember-Beitrags besondere Aufmerksamkeit verdient.

Das Dilemma der universellen Prävention

Wenn der durchschnittliche Nutzen einer universellen Intervention klein ist, gewinnt die Frage nach möglichen Schäden besonderes Gewicht. Genau hier liefert die Metaanalyse von Lemberger-Truelove et al. (2026) eine aufschlussreiche Differenzierung.

Universelle Programme – also solche, die sich an alle Schüler richten, unabhängig von individuellem Bedarf – erzielten eine Effektstärke von lediglich g = 0,056. Zielgerichtete Interventionen für Jugendliche mit erhöhtem Risiko kamen hingegen auf g = 0,148 – fast das Dreifache (Lemberger-Truelove et al., 2026). Dieses Muster war erwartbar und ist konsistent mit der bisherigen Evidenzlage.

Die Brisanz entsteht erst im Zusammenspiel mit den Schadensbefunden: Guzman-Holst et al. (2025) hatten berichtet, dass 8,93 % der untersuchten Interventionen mindestens ein negatives Ergebnis aufwiesen – ein Anteil, der in methodisch hochwertigen Studien auf 33,33 % anstieg. Diese negativen Effekte umfassten unter anderem eine Zunahme depressiver Symptome, eine Abnahme von Wohlbefinden sowie Verschlechterungen beim prosozialen Verhalten. Wenn nun der erwartbare Nutzen eines universellen Programms bei einem g von 0,056 liegt – also sehr nahe an null –, dann können selbst moderate iatrogene Wirkungen bei Subgruppen das Gesamtbild ins Negative kippen.

Anders formuliert: Ein Programm, das im Durchschnitt einen minimalen Nutzen zeigt, kann gleichzeitig einer Mehrheit wenig bringen und einer Minderheit aktiv schaden. Der Durchschnitt verdeckt dann die Probleme, die in den Rändern der Verteilung auftreten. Das heißt nicht, dass universelle Prävention grundsätzlich falsch ist – aber es heißt, dass der bekannte Zielkonflikt zwischen Reichweite und Wirktiefe nicht abstrakt bleiben darf, sondern systematisch beobachtet und gesteuert werden muss.

Wo die Befunde zusammenlaufen: Fünf Brücken zwischen beiden Studien

Die Metaanalyse von Lemberger-Truelove et al. (2026) wurde nicht mit dem Ziel durchgeführt, iatrogene Effekte zu untersuchen. Dennoch finden sich in ihren Ergebnissen mehrere Anknüpfungspunkte, die unsere früheren Überlegungen vertiefen.

1. Erhöhtes Problembewusstsein (engl. Awareness) ohne Bewältigungsstrategien – und das Problem langer Programme

In unserem Dezember-Beitrag hatten wir einen der plausibelsten Erklärungsmechanismen für negative Effekte diskutiert: KVT- und achtsamkeitsbasierte Programme können dazu führen, dass Jugendliche sich ihrer negativen Gedanken und Gefühle stärker bewusst werden, ohne gleichzeitig ausreichende Strategien zu erlernen, diese zu bewältigen. Stoppelbein (2003, zitiert nach Guzman-Holst et al., 2025) hatte beschrieben, wie ein Programm Teilnehmende lehrte, sich negativer Kognitionen bewusst zu werden, die Strategien zu deren Bearbeitung aber erst in den letzten Sitzungen vermittelte.

Die Metaanalyse von Lemberger-Truelove et al. (2026) wirft nun ein indirektes, aber aufschlussreiches Licht auf diesen Mechanismus: In einer sogenannten Metaregression – einem Verfahren, das den Zusammenhang zwischen einer Studieneigenschaft und der Effektstärke prüft – zeigte sich, dass kürzere Interventionen tendenziell größere Effekte erzielten als längere. Pro zusätzlicher Woche Programmdauer sank die Effektstärke geringfügig (β = −0,0027), wobei dieser Zusammenhang knapp die statistische Signifikanzgrenze verfehlte (p = 0,0693; Lemberger-Truelove et al., 2026). Die Autorinnen und Autoren erklären dies unter anderem mit nachlassender Implementierungstreue und abnehmenden Grenzeffekten über die Zeit. Der Befund lässt sich aber auch anders lesen: Möglicherweise erreichen manche längeren Programme einen Punkt, an dem die fortgesetzte Fokussierung auf innere Zustände – ohne proportional wachsende Bewältigungskompetenzen – kontraproduktiv wird. Das wäre genau der Mechanismus, den Guzman-Holst et al. (2025) als „erhöhtes Problembewusstsein ohne ausreichende Bewältigungsstrategien“ beschrieben haben.

2. Wer die Intervention durchführt, macht einen Unterschied – auch für das Schadenspotenzial

Schulische Fachkräfte für psychische Gesundheit erzielten in der Metaanalyse die größten Effekte (g = 0,157), während lehrkräftegeleitete Interventionen die geringsten Wirkungen zeigten (g = 0,041; Lemberger-Truelove et al., 2026).

Dieser Befund hat eine unmittelbare Verbindung zur Schadensprävention. Die AWARE-Studie hatte gezeigt, dass YAM insbesondere in Schulen ohne vorherige universelle Programme zur psychischen Gesundheit zu erhöhten emotionalen Schwierigkeiten führte (Department for Education, 2025). Unsere damalige Interpretation: Schulen ohne Erfahrung mit psychischer Gesundheitskompetenz (engl. Mental Health Literacy) sind möglicherweise weniger gut gerüstet, um mit den Folgen erhöhten Problembewusstseins umzugehen.

Wenn nun geschultes Fachpersonal nachweislich bessere Ergebnisse erzielt, liegt ein naheliegender Grund darin, dass diese Personen auch besser in der Lage sind, aufkommende Belastungsreaktionen bei Teilnehmenden frühzeitig zu erkennen und darauf zu reagieren. Lehrkräfte, die ein standardisiertes Curriculum zur psychischen Gesundheit durchführen, ohne über vertiefte Kenntnisse in Psychopathologie zu verfügen, können womöglich schlechter einschätzen, wann ein Programm bei einzelnen Jugendlichen problematische Prozesse auslöst – und wann eine Nachsteuerung notwendig wäre. Bemerkenswert ist, dass hier nicht der Inhalt der Intervention den Unterschied macht, sondern der Kontext ihrer Durchführung – ein Muster, das sich durch mehrere der folgenden Befunde zieht.

3. Individualsettings zeigen null Effekt – ein Warnsignal

Ein Befund, der in der Metaanalyse eher beiläufig berichtet wird, verdient besondere Aufmerksamkeit: Individuelle Interventionen im schulischen Kontext zeigten praktisch keinen messbaren Effekt (g = −0,002; Lemberger-Truelove et al., 2026). Die Autorinnen und Autoren erklären dies damit, dass individuelle Herausnahme-Angebote (engl. pull-out) in Schulen stigmatisierender wirken können als in klinischen Kontexten und logistische Komplikationen mit sich bringen.

Für die Schadensdiskussion ist dieser Befund auch aus einem weiteren Grund relevant: Lemberger-Truelove et al. (2026) erklären den Nulleffekt unter anderem damit, dass individuelle Herausnahme-Angebote in Schulen stigmatisierender wirken können als in klinischen Settings. Wenn Jugendliche einzeln aus dem Unterricht herausgenommen werden, um an einer Mental-Health-Intervention teilzunehmen, werden sie als „behandlungsbedürftig“ markiert – eine Etikettierung, die gerade in der identitätssensiblen Phase der Adoleszenz kontraproduktiv wirken kann. Dieser Stigmatisierungsmechanismus ergänzt den von Guzman-Holst et al. (2025) beschriebenen Mechanismus des sozialen Vergleichs innerhalb von Gruppeninterventionen, bei dem Teilnehmende, die nicht profitieren, sich mit profitierenden Gleichaltrigen (engl. Peers) vergleichen. Das Ergebnis von Lemberger-Truelove et al. (2026) deutet darauf hin, dass diese potenzielle Schädigung den potenzielle Nutzen in schulischen Einzelkontexten vollständig aufwiegen könnte.

4. Das Rätsel der Theorie – und die ungeklärten Wirkmechanismen

In unserem Dezember-Beitrag hatten wir als beunruhigend hervorgehoben, dass 45,5 % der Studien mit negativen Ergebnissen keine direkten Erklärungen für die schlechteren Ergebnisse der Interventionsgruppe lieferten (Guzman-Holst et al., 2025). Die Metaanalyse offenbart nun ein komplementäres Problem auf der Seite der positiven Effekte: Auch hier bleibt häufig unklar, warum Interventionen wirken.

Das zeigt sich an einem zunächst paradoxen Befund: Interventionen ohne explizite theoretische Grundlage erzielten deskriptiv größere Effekte als theoretisch fundierte Programme (Lemberger-Truelove et al., 2026). Das bedeutet nicht, dass Theorie schadet – eine frühere Metaanalyse derselben Erstautorengruppe kam zum gegenteiligen Ergebnis (Lemberger-Truelove et al., 2025, zitiert nach Lemberger-Truelove et al., 2026). Es deutet jedoch auf eine gravierende Theorie-Praxis-Lücke hin: Kim et al. (2024, zitiert nach Lemberger-Truelove et al., 2026) fanden in einer Inhaltsanalyse, dass weniger als die Hälfte der untersuchten Studien theoretisch relevante Konstrukte maßen und nur 20 % ihre Ergebnisse im Bezug zur Theorie diskutierten.

Diese Lücke hat direkte Konsequenzen für die Schadensprävention: Wenn wir nicht ausreichend verstehen, durch welche Mechanismen Interventionen positive Effekte erzeugen, können wir auch schwer vorhersagen, unter welchen Bedingungen dieselben Mechanismen ins Negative kippen. Die beiden Studienlinien – Schadensbefunde und Wirksamkeitsforschung – konvergieren hier in einer gemeinsamen Forderung nach rigoroserer Theoriearbeit und Untersuchung von Wirkmechanismen. Möglicherweise liegt das Problem aber nicht nur in mangelnder Theorie, sondern in der Analyseebene: Die dominierenden Theorien des Feldes – KVT, Achtsamkeit, Psychoedukation – modellieren Veränderung auf der Ebene individueller Kognitionen und Kompetenzen. Was sie nicht modellieren, sind die Kontextbedingungen, die über Erfolg oder Schaden einer Intervention entscheiden.

5. Implementierungstreue: Notwendig, aber nicht hinreichend – eine Bestätigung

Die AWARE-Studie hatte gezeigt, dass YAM nur bei vollständiger Durchführung aller fünf Sitzungen kurzfristig positive Effekte zeigte, gleichzeitig aber langfristig (9–12 Monate nach der Intervention) erhöhte emotionale Schwierigkeiten bei den Teilnehmenden insgesamt auftraten (Department for Education, 2025). Lemberger-Truelove et al. (2026) betonen ihrerseits, dass die in ihrer Metaanalyse beobachtete geringe Heterogenität der Effekte zum Teil die strengen methodischen Einschlusskriterien widerspiegeln dürfte – und dass die Effekte in der Praxis, unter weniger kontrollierten Bedingungen, erheblich variieren könnten.

Beide Befunde zusammen ergeben ein konsistentes Bild: Implementierungstreue ist eine notwendige, aber keine hinreichende Bedingung für den Erfolg schulischer Interventionen zur psychischen Gesundheit. Selbst sorgfältig umgesetzte Programme können unbeabsichtigte Wirkungen entfalten, wenn sie nicht zum Kontext, zur Zielgruppe und zu den vorhandenen Unterstützungsstrukturen passen.

Was folgt daraus für die Praxis?

Die Kombination beider Forschungsstränge – die Schadensbefunde vom Dezember und die Wirksamkeitsbefunde von Lemberger-Truelove et al. (2026) – verdichtet sich zu einem klaren Orientierungsrahmen für die schulische Prävention und Gesundheitsförderung.

Universelle Programme haben ihren Platz – aber er muss realistisch bestimmt werden. Die Stärke universeller Prävention liegt in ihrer Reichweite, der Reduktion von Stigma und der Möglichkeit, Probleme zu verhindern, bevor sie entstehen. Doch ein durchschnittlicher Effekt von g = 0,056 (Lemberger-Truelove et al., 2026) bedeutet auch: Universelle Programme allein werden den beobachteten Anstieg psychischer Probleme bei Jugendlichen nicht aufhalten. Sie sollten als Fundament einer gestuften Präventionsstrategie verstanden werden – nicht als alleinige Lösung. Und sie sollten so gestaltet sein, dass ihr bekanntes Schadenspotenzial bei vulnerablen Subgruppen systematisch minimiert wird.

Der größte Hebel liegt in zielgerichteten Kleingruppen mit geschultem Fachpersonal. Kombinierte Einzel- und Kleingruppenformate erzielten in der Metaanalyse die mit Abstand größten Effekte (g = 0,867), gefolgt von reinen Kleingruppenformaten (g = 0,138). Auch die Durchführung durch spezialisierte schulische Fachkräfte für psychische Gesundheit zeigte deskriptiv die größten Effekte unter den Durchführendengruppen (g = 0,157; Lemberger-Truelove et al., 2026). Für Schulen und Träger bedeutet das: Investitionen in die Qualifikation der Durchführenden und in Systeme, die Jugendliche mit erhöhtem Bedarf frühzeitig identifizieren, sind vermutlich wirksamer als die flächendeckende Einführung eines weiteren universellen Curriculums. Gleichzeitig bieten professionell geleitete Kleingruppen auch einen besseren Rahmen, um iatrogene Prozesse – wie erhöhtes Problembewusstsein ohne Bewältigungsstrategien oder problematische soziale Vergleiche – frühzeitig zu erkennen und aufzufangen.

Systematische Verlaufsbeobachtung (engl. Monitoring) bleibt unverzichtbar. Sowohl die Schadensbefunde als auch die kleinen Effektgrößen unterstreichen die Notwendigkeit, Wirkungen systematisch und langfristig zu erfassen. Dies ist nicht nur Qualitätssicherung, sondern eine ethische Verpflichtung gegenüber den Jugendlichen, denen wir mit unseren Programmen helfen wollen.

Der blinde Fleck

Bei aller Differenzierung bleibt eine grundlegendere Frage ungestellt – in beiden Studien und im gesamten Feld, das sie repräsentieren: Ob die Vermittlung psychologischer Inhalte an Schüler überhaupt der richtige Ansatzpunkt ist.

Die gesamte diskutierte Literatur operiert innerhalb eines curricularen Paradigmas: Jugendliche erhalten ein Programm – KVT-basiert, achtsamkeitsbasiert, psychoedukativ –, und die Forschung fragt, ob dieses Programm im Durchschnitt etwas bewirkt. Diese Logik ist kompensatorisch: Sie unterstellt ein Defizit beim Individuum (fehlende Bewältigungsstrategien, mangelndes Problembewusstsein) und versucht, es durch Wissensvermittlung, Kompetenzerwerb und Vermittlung in Psychotherapie auszugleichen. Was sie nicht fragt: Was in der Umgebung der Kinder und Jugendlichen – im Schulklima, in den Gleichaltrigenbeziehungen, in den familiären Bedingungen, in den sozioökonomischen Strukturen – Belastung erzeugt oder verstärkt.

Dabei zeigen gerade die hier diskutierten Befunde, dass der Kontext wichtiger sein könnte als der Inhalt: Schulen ohne vorherige Versorgung im Bereich psychischer Gesundheit zeigten schlechtere Ergebnisse (Department for Education, 2025). Spezialisiertes Fachpersonal erzielte bessere Effekte als Lehrkräfte (Lemberger-Truelove et al., 2026). Vulnerable Subgruppen wurden häufiger geschädigt als die Gesamtgruppe (Guzman-Holst et al., 2025). All das deutet darauf hin, dass die Bedingungen, unter denen eine Intervention stattfindet, mindestens so viel erklären wie das Programm selbst.

Die Alternative lautet nicht, bessere Programme zu entwickeln, sondern die Fragerichtung umzukehren – von „Welches Programm wirkt?“ zu „Welche Risiko- und Schutzfaktoren prägen das Aufwachsen der Heranwachsenden an dieser Schule, und wie lassen sie sich verändern?“ Dieser entwicklungsökologische Ansatz beginnt nicht mit einem Curriculum, sondern mit Daten über die Lebenswirklichkeit – und wählt erst auf dieser Grundlage Maßnahmen aus, die auf die identifizierten Faktoren zielen. Programme werden so zum Werkzeug innerhalb einer Strategie, nicht zum Selbstzweck. Eine solche Perspektive würde auch den hier diskutierten Schadensbefunden besser gerecht: Wer die spezifischen Belastungen und Ressourcen einer Schülerschaft kennt, kann abschätzen, für wen eine Intervention hilfreich und für wen sie riskant sein könnte – bevor das Programm beginnt, nicht erst, wenn der Schaden eingetreten ist.

Fazit

Die Metaanalyse von Lemberger-Truelove et al. (2026) bestätigt, was die Präventionswissenschaft seit langem postuliert: Schulbasierte Interventionen zur psychischen Gesundheit können einen positiven Beitrag leisten. Gleichzeitig zeigt sie – im Zusammenspiel mit den Schadensbefunden von Guzman-Holst et al. (2025) und der AWARE-Studie –, dass dieser Beitrag bei universellen Programmen sehr klein ausfällt und dass die Art der Durchführung einen erheblichen Unterschied macht.

Für die Fachgemeinschaft ergibt sich daraus weniger eine Überraschung als eine Bestätigung und Schärfung: Differenzierung schlägt Gießkanne. Schulische Prävention braucht gestufte Systeme, in denen universelle Angebote das Fundament bilden, der eigentliche Wirkungshebel aber in bedarfsorientierten, professionell durchgeführten Interventionen liegt. Und sie braucht die Bereitschaft, auch unbequeme Fragen zu stellen – nicht nur danach, ob ein Programm im Durchschnitt etwas bewirkt, sondern auch danach, wem es hilft, wem es nicht hilft und wem es möglicherweise schadet.

Literatur

Cai, C., Mei, Z., Wang, Z. & Luo, S. (2025). Effects of school-based resilience interventions on resilience in children and adolescents: A systematic review and meta-analysis of randomized controlled trials. Journal of Affective Disorders, 346, 294–305. https://doi.org/10.1016/j.jad.2023.11.028

Department for Education. (2025). Effectiveness of school mental health awareness interventions: Universal approaches in English secondary schools (Government Social Research Report RR1489). https://files.eric.ed.gov/fulltext/ED672206.pdf

Guzman-Holst, C., Davis, R. S., Andrews, J. L. & Foulkes, L. (2025). Scoping review: Potential harm from school-based group mental health interventions. Child and Adolescent Mental Health, 30(3), 208–222. https://doi.org/10.1111/camh.12760

Kim, H., Lemberger-Truelove, M. E., Wills, L. N., Basner, E. J. & Tipton, J. L. (2024). Use of theory in school counselor-delivered intervention research: A systematic content analysis. Professional School Counseling, 27, 1–14. https://doi.org/10.1177/2156759X231225025

Lemberger-Truelove, M. E., Li, D., Kim, H., Hill, D. D., Dickson, R. & Kang, Z. (2026). School mental health interventions for adolescents: A meta-analysis of effectiveness and relevant moderators. Adolescents, 6(1), 6. https://doi.org/10.3390/adolescents6010006

Lemberger-Truelove, M. E., Li, D., Kim, H., Wills, L., Thompson, K. & Lee, Y.-Y. (2025). Effectiveness of school counselor-delivered social and emotional learning interventions: A meta-analysis. Journal of Counseling & Development, 103, 39–48. https://doi.org/10.1002/jcad.12517

Sanchez, A. L., Cornacchio, D., Poznanski, B., Golik, A. M., Chou, T. & Comer, J. S. (2018). The effectiveness of school-based mental health services for elementary-aged children: A meta-analysis. Journal of the American Academy of Child & Adolescent Psychiatry, 57(3), 153–165. https://doi.org/10.1016/j.jaac.2017.11.022

Stoppelbein, L. (2003). Primary prevention: An evaluation of a high-school based cognitive behavioral program [Dissertation, University of Alabama].

Whitney, D. G. & Peterson, M. D. (2019). US national and state-level prevalence of mental health disorders and disparities of mental health care use in children. JAMA Pediatrics, 173(4), 389–391. https://doi.org/10.1001/jamapediatrics.2018.5399

Zhang, Q., Wang, J. & Neitzel, A. (2023). School-based mental health interventions targeting depression or anxiety: A meta-analysis of rigorous randomized controlled trials for school-aged children and adolescents. Journal of Youth and Adolescence, 52, 195–217. https://doi.org/10.1007/s10964-022-01684-4

FINDER e.V.

Schützenstraße 6A

10117 Berlin