Einleitung: Drei Jahre nach dem letzten Förderbescheid
Ein typischer Verlauf, dokumentiert aus zahlreichen kommunalen Präventionsprojekten: Ein dreijähriges Suchtpräventionsprogramm, mitfinanziert über das Präventionsgesetz, getragen von einer Steuerungsgruppe aus Schulen, Suchthilfe und Polizei. Die Evaluation bescheinigt Reichweite und positive Effekte auf riskanten Konsum. Vier Jahre nach Förderende ist die Steuerungsgruppe aufgelöst, das Curriculum digital archiviert, die geschulte Lehrkraft an einer anderen Schule, ein Folgeprojekt nicht in Sicht. Die Evaluation steht in der Schublade.
Solche Muster sind in der Implementationsforschung gut beschrieben. Wiltsey Stirman et al. (2012) werteten 125 Studien zur Nachhaltigkeit von Gesundheitsprogrammen aus, mit nüchternem Befund: Vollständige Fortführung mit hoher Programmtreue ist selten; partielle Verstetigung mit Erosion einzelner Komponenten ist der Normalfall. Shelton et al. (2018) bestätigen das in einer aktuelleren Synthese: Über sehr heterogene Programme hinweg bleibt grob die Hälfte ein bis sechs Jahre nach Einführung zumindest teilweise bestehen, fast immer in angepasster Form.
Ein erheblicher Teil der deutschsprachigen Prävention läuft im Schulsetting – Klasse2000, IPSY, Lions Quest, Klar bleiben, Eigenständig werden, Faustlos sind allesamt schulbasiert. Damit ist schulische Suchtprävention zugleich Bildungsinnovation: dieselben Lehrkräfte, dieselben Schulleitungen, dieselbe Curriculum-Verträglichkeit entscheiden über Verstetigung. Die Bildungsforschung zur Verstetigung schulischer Innovationen (Prenger et al., 2022) ist deshalb nicht analog, sondern direkt einschlägig. Eigenständige Konturen gewinnt die Implementationsforschung des Gesundheitswesens (Damschroder et al., 2022; Wiltsey Stirman et al., 2012; Shelton et al., 2018) vor allem dort, wo Prävention außerhalb der Schule stattfindet – in Kommunen, Suchthilfe, Jugendhilfe, Frühen Hilfen. Der vorliegende Beitrag bündelt beide Stränge und sortiert, wo welcher trägt.
Was meint Nachhaltigkeit, wenn man genau hinsieht?
Der Begriff Nachhaltigkeit funktioniert in der Präventionsforschung als Sammelbegriff für mehrere unterscheidbare Phänomene. Moore et al. (2017) extrahierten aus 209 Studien 24 Definitionen und kondensierten sie auf fünf Konstrukte: Fortbestehen über einen definierten Zeitraum, Fortführung der Programmaktivitäten, Aufrechterhaltung individueller Verhaltensänderung, Möglichkeit zur Anpassung und anhaltender Nutzen für Umsetzende und Zielgruppe.
Proctor et al. (2011) ordnen Nachhaltigkeit in eine Reihe von acht Umsetzungsergebnissen ein, neben Akzeptanz, Adoption, Angemessenheit, Machbarkeit, Programmtreue, Umsetzungskosten und Durchdringung. Diese Einordnung verändert die Argumentationsfigur: Verstetigung ist nicht der Endzustand eines linearen Umsetzungsprozesses, sondern ein eigenständiges Ergebnis, das gemessen, finanziert und gestaltet werden muss.
Scheirer (2005) hat früh ein Kontinuum vorgeschlagen, das von der bloßen Fortführung einzelner Aktivitäten über die Aufrechterhaltung individueller Wirkungen bis zur strukturellen Routinisierung in der Trägerorganisation reicht. Scheirer und Dearing (2011) verdichteten das für die Praxis im Gesundheitswesen zu fünf Ergebnisklassen, die heute als analytisches Skelett vieler empirischer Arbeiten dienen.
Für den deutschsprachigen Diskurs lohnt sich eine terminologische Trennung in Verstetigung (Programm bleibt bestehen), Wirkungserhalt (Effekte bleiben messbar) und Routinisierung (Programm geht in den Regelbetrieb über). Die in der Bildungsliteratur verbreitete Definition (Prenger et al., 2022) – Integration in organisatorische Routinen mit Erhalt verbesserter Ergebnisse – verschmilzt zwei dieser drei Aspekte. Das verstellt den Blick auf Fälle, in denen Programme routinisiert sind, ohne noch Wirkung zu zeigen, oder umgekehrt Wirkung zeigen, ohne organisatorisch verankert zu sein.
Theoretische Verortung: Verbreitung, Routinisierung, Komplexität
Die folgenden Modelle stammen überwiegend aus der gesundheitsbezogenen Implementationsforschung und sind setting-agnostisch formuliert; ihren spezifischen Mehrwert entfalten sie vor allem dort, wo schulische Standardstrukturen nicht greifen – in Kommunen, Suchthilfe, Jugendhilfe, Frühen Hilfen. Für rein schulbasierte Programme liefert der bildungswissenschaftliche Strang (Prenger et al., 2022) ergänzend ein engeres, direkt einsetzbares Raster.
Die Implementationsforschung im Gesundheitswesen arbeitet seit Mitte der 2000er Jahre mit einer Handvoll theoretischer Anker. Greenhalgh et al. (2004) legten mit ihrem meta-narrativen Review zur Verbreitung von Innovationen in Gesundheitsdiensten die Grundlage: Verbreitung verläuft nicht linear, sondern über soziale Netzwerke, lokale Bedeutungsaushandlungen und Akteurskonstellationen. Innovationen "passieren" Organisationen, sie werden nicht in sie hineingeladen.
Ihre eigene Weiterentwicklung – das NASSS-Rahmenmodell (Greenhalgh et al., 2017) – benennt sieben Komplexitätsdomänen, deren Zusammenspiel erklärt, warum gut konzipierte Innovationen in der Skalierung scheitern: die zu adressierende Bedingung, die Technologie, das Wertversprechen, die Anwender, die Organisation, der weitere Kontext und die Anpassung über die Zeit. Nachhaltigkeit erscheint hier nicht als Eigenschaft des Programms, sondern als emergente Eigenschaft eines soziotechnischen Gefüges.
May (2013) liefert mit der Normalisierungs-Prozess-Theorie das Mikrofundament. Routinisierung gelingt, wenn vier Mechanismen zusammenwirken: Verstehen (die Beteiligten begreifen, was sie tun), Mitwirkung (sie verpflichten sich zur gemeinsamen Arbeit), kollektives Handeln (sie investieren Ressourcen) und reflexives Beobachten (sie prüfen und passen an). Programme, die einen dieser Mechanismen vernachlässigen, kollabieren in der Verstetigungsphase oft genau an dieser Stelle.
Damschroder et al. (2022) haben mit dem aktualisierten Consolidated Framework for Implementation Research (CFIR) einen Ordnungsrahmen vorgelegt, der heute in der Implementationsforschung Standard ist: Innovation, äußerer Kontext, innerer Kontext, Individuen, Prozess. Die Aktualisierung von 2022 ergänzt explizit Determinanten der Versorgungsgerechtigkeit – ein Hinweis darauf, dass Nachhaltigkeit ohne soziale Lage und Zugangsgerechtigkeit unzureichend gedacht ist.
Glasgow et al. (2019) bilanzieren 20 Jahre RE-AIM (Reichweite, Wirksamkeit, Adoption, Umsetzung, Aufrechterhaltung). Aufrechterhaltung meint dort sowohl die individuelle Fortdauer von Effekten als auch die organisatorische Aufrechterhaltung des Programms. Diese Doppelung ist eine analytische Errungenschaft, die in deutschen Programmevaluationen bislang selten umgesetzt wird.
Bertram et al. (2014) ergänzen das im National Implementation Research Network um vier pragmatische Umsetzungsstufen: Erkundung, Installation, Erstumsetzung, vollständige Umsetzung. Verstetigung beginnt in diesem Modell nicht nach der Umsetzung, sondern wird ab Stufe 1 mitgeplant.
Epistemisch markieren diese Modelle eine Verschiebung: weg vom Zielzustand, hin zu einem prozessualen Verständnis, in dem Anpassungsfähigkeit, Lernen und Reflexion die eigentlichen Dauerleistungen sind. Sie sind selbst nicht unwidersprochen: Es sind Taxonomien, die viele Determinanten benennen, ohne deren Gewicht oder kausale Mechanik zu modellieren – Kritik, die jedes Update nur teilweise adressiert.
Eine zeitliche Klärung ist nötig: "Verstetigt" ist relativ zu einem definierten Beobachtungszeitraum. Studien arbeiten mit Horizonten von zwei bis neun Jahren nach Einführung; eine universelle Schwelle existiert nicht. Wer Verstetigung diskutiert, sollte den Horizont benennen.
Rahmenmodelle im Vergleich
Tabelle 1 stellt die einflussreichsten Verstetigungs-Rahmenmodelle der letzten zwölf Jahre gegenüber; sie überlappen erheblich, setzen aber unterschiedliche Schwerpunkte.
Tabelle 1. Verstetigungs-Rahmenmodelle im Überblick
| Rahmenmodell | Quelle | Herkunft | Strukturierungsprinzip | Eignung |
|---|---|---|---|---|
| Wiltsey-Stirman-Review | Wiltsey Stirman et al. (2012) | Implementationsforschung, 125 Studien | Setting, Innovation, Prozesse, Kapazitäten | Definitorischer Anker; Normfall partielle Verstetigung |
| Sustainability-Capacity-Framework | Schell et al. (2013) | Gesundheitswesen, 85 Studien plus Konzept-Mapping | 9 Domänen: politische Unterstützung, Finanzierung, Partnerschaften, Organisationskapazität, Evaluation, Anpassung, Kommunikation, Wirkung, Strategie | Operationalisiert für Trägerorganisationen |
| Program Sustainability Assessment Tool (PSAT) | Luke et al. (2014) | Gesundheitswesen, validiertes 40-Item-Instrument | 8 Skalen, Selbstaudit | Praxisdiagnostik, Selbstanalyse |
| Ergebnis-Rahmenmodell | Proctor et al. (2011) | Implementationsforschung | 8 Umsetzungsergebnisse, Nachhaltigkeit als eigenständige Größe | Studiendesign, Wirkungsketten |
| RE-AIM | Glasgow et al. (1999, 2019) | Wirkungsevaluation im Gesundheitswesen | Reichweite, Wirksamkeit, Adoption, Umsetzung, Aufrechterhaltung | Wirkungsbreite, Aufrechterhaltung auf zwei Ebenen |
| CFIR (Update) | Damschroder et al. (2022) | Implementationsforschung | Innovation, äußerer/innerer Kontext, Individuen, Prozess; Versorgungsgerechtigkeit ergänzt | Determinantenanalyse |
| NASSS | Greenhalgh et al. (2017) | Komplexitätsforschung | 7 Domänen, soziotechnisch | Erklärt Skalierungs- und Verstetigungsfehlschläge |
| Bildungs-Verstetigungsmodell | Prenger et al. (2022) | Bildungswissenschaft, 44 Studien | 4 Kategorien: organisationale, Innovations-, individuelle, Kontext-Merkmale | Schulkontext; eingeschränkt übertragbar |
Anzumerken ist: Prenger et al. (2022) ordnen ihre vier Hauptkategorien als organisationale Merkmale (Führung als Subdomäne), Innovations-Merkmale, individuelle Merkmale und Kontextmerkmale (politisch-rechtliche Rahmen, Förderlogik, externe Zusammenarbeit). Wer diese vierte Kategorie in der Praxisrezeption verkürzt – etwa zugunsten einer eigenständigen Führungsdomäne –, lässt jenen Faktor in den Hintergrund treten, der in der Verstetigungsforschung als gewichtigster gilt: stabile politische und finanzielle Rahmenbedingungen (Schell et al., 2013).
Determinanten: vier Ebenen, viele Konjunktive
Die Befunde zu Einflussfaktoren der Nachhaltigkeit lassen sich – CFIR-konform – auf vier Ebenen ordnen. Die Empirie dokumentiert dabei überwiegend Korrelationen, selten Kausalitäten.
Äußerer Kontext. Politische Unterstützung und stabile Finanzierung sind die am besten belegten Prädiktoren. Schell et al. (2013) zeigen in ihrer Konzept-Mapping-Studie mit Forschenden, Geldgebern und Praktikern, dass beide Domänen über alle Beteiligtengruppen hinweg als zentral gelten. Im deutschen kommunalen Kontext ist dieser Rahmen prekär: Bewegungs- und Gesundheitsförderung sind keine Pflichtaufgabe der Kommunen; Verstetigung hängt regelhaft an einzelnen Engagierten (Müller et al., 2022). Das Präventionsgesetz von 2015 hat das nicht aufgelöst, sondern die Förderkonkurrenz strukturiert (Dadaczynski et al., 2022).
Innerer Kontext. Organisationskultur, Führung, Wissensmanagement und Personalfluktuation sind etablierte Faktoren. Prenger et al. (2022) systematisieren sie für den Bildungsbereich; Shelton et al. (2018) zeigen, dass sie in Gesundheits- und Sozialdiensten greifen, wenn auch mit anderen Gewichtungen. Verteilte Führung ist im Schulkontext gut belegt; in Suchthilfe und kommunaler Jugendpflege fehlen vergleichbar große Studien.
Innovation. Wirksamkeit, Programmtreue und Anpassungsfähigkeit stehen in einem Spannungsverhältnis. Faggiano et al. (2014) zeigen im Cochrane-Review zu universellen schulischen Drogenpräventionsprogrammen: Curricula mit Fertigkeitenkomponente und sozialem Einflussmodell wirken; reine Wissensvermittlung nicht. Programme mit klaren Kernkomponenten lassen sich besser verstetigen, weil eine Treueprüfung möglich bleibt – sie sind aber zugleich weniger anpassungsfähig. Shelton et al. (2018) lösen dieses Spannungsverhältnis nicht auf, sondern formulieren es als zentrale Umsetzungsherausforderung.
Individuen und Prozesse. Einstellungen, Selbstwirksamkeit und Wissen der Fachkräfte sind oft signifikante Prädiktoren, selten alleinige Treiber. Brown et al. (2010) zeigen in ihrer Längsschnittanalyse von 62 Communities-That-Care-Koalitionen in Pennsylvania: Finanzierung, Führung, Effizienz, Beziehungsqualität und Modelltreue sagen die Umsetzungsqualität evidenzbasierter Programme voraus. Höhere Armut der Kommune und längere Bestandsdauer der Koalition korrelieren negativ mit der Umsetzungsqualität – ein Befund, der die Annahme "lange dabei = besser etabliert" konterkariert.
Determinantenlisten in Praxispublikationen reihen oft ein Dutzend Subfaktoren ohne relative Gewichtung, Wechselwirkungen oder Trennung von kausal und koexistierend aneinander. Das ist nicht falsch, aber unscharf – und es lässt offen, an welchem Hebel zuerst gezogen werden sollte.
Internationale Programmbefunde
Eine der empirisch dichtesten Programmgeschichten ist Communities That Care (CTC) – einer der wenigen kommunalen Präventionsansätze mit clusterrandomisierten Studien und Kosten-Nutzen-Analysen über mehrere Jahre.
Hawkins et al. (2009) berichten erste Ergebnisse: 24 US-Kommunen, gepaart und randomisiert; signifikant niedrigere Initiierungsraten für Alkohol-, Tabak- und Delinquenzbeginn bis Klassenstufe 8. Acht Jahre später, drei Jahre nach Ende der Bundesförderung, war die kumulative Wahrscheinlichkeit, Substanzkonsum, Delinquenz oder Gewalt jemals begonnen zu haben, in den CTC-Kommunen weiterhin signifikant niedriger; die 30-Tage-Prävalenz aktuellen Konsums unterschied sich nicht mehr (Hawkins et al., 2014). Die Differenzierung ist zentral: Verstetigte Prävention verschiebt den Erstkonsum nach hinten, verhindert ihn aber nicht dauerhaft, sobald die Unterstützungsstruktur erodiert.
Kuklinski et al. (2012) berechneten für Klassenstufe 8 ein Verhältnis von 5,30 US-Dollar pro investiertem Dollar; in alternativer Modellierung bis zu 10,23 Dollar. Bei Klassenstufe 12 lag der Punktschätzer bei 8,22 Dollar mit breiten Sensitivitätsintervallen, die interne Verzinsung bei 21 Prozent, die Gewinnschwelle nach neun Jahren – auch bei halbierten Effekten (Kuklinski et al., 2015). Eine australische Replikation 2024 erzielte ein niedrigeres, stabiles Verhältnis von 2,60 AUD pro investiertem AUD (Abimanyi-Ochom et al., 2024) – ein Hinweis, dass Effektgrößen kontextabhängig sind und sich nicht eins zu eins übertragen lassen.
Auf Programmebene liefert der Cochrane-Review von Faggiano et al. (2014) den klassenbezogenen Befund: Universelle schulische Drogenpräventionscurricula mit Fertigkeiten- und sozialer Einfluss-Komponente reduzieren den Konsum signifikant; reine Wissensvermittlung nicht. Unplugged gehört zur wirksamen Klasse, ist aber nicht die einzige Belegstudie. Für digitale Präventionsangebote – niedrigere Verbreitungskosten, andere Fragen zur Programmtreue, Verstetigung an Plattformbetrieb und Datenpflege gebunden – liefert NASSS (Greenhalgh et al., 2017) den passenden Rahmen.
Die Skalierung evidenzbasierter Interventionen ist weniger eine Frage der Programmqualität als der Systemarchitektur. Fagan et al. (2019) identifizieren vier Hebel: öffentliche Politik, stabile Förderung, qualifiziertes Personal, kontinuierliche Wirkungsbeobachtung. In deutschen Bundes- und Landesförderlogiken sind diese Hebel zumeist nur teilweise vorhanden.
Deutschsprachige Empirie
Die deutschsprachige Empirie zur Verstetigung schulischer und kommunaler Prävention ist dünner als die US-amerikanische, aber nicht leer.
Hansen et al. (2011) führten mit Eigenständig werden eine clusterrandomisierte Studie an 45 Schulen mit 3.444 Fünftklässlern durch – ein Lebenskompetenzprogramm mit Elternkomponente, dessen primäre Effekte auf den Substanzkonsumbeginn dokumentiert sind. Klasse2000 erreicht nach Eigenangaben über 1,4 Millionen Kinder seit Programmstart; eine vierjährige Kontrollgruppenstudie in Hessen weist niedrigere Alkoholkonsumintensität bei Vorbelasteten, höhere gesundheitsbezogene Kenntnisse, besseres Klassenklima und reduzierte Verhaltensprobleme aus (Isensee & Hanewinkel, 2009). Eine größere Propensity-Score-Matching-Studie ist im Protokoll von Kliem et al. (2020) angelegt; die Ergebnispublikation steht aus. Bei IPSY dokumentieren Spaeth et al. (2010) in einer thüringischen Längsschnittstudie mit 1.484 Jugendlichen Effektgrößen um d = 0,33 für die Verlangsamung problematischer Alkoholverläufe; Weichold et al. (2016) zeigen in derselben Längsschnitt-Studie eine Mediation des Tabakeffekts über reduziertes Nachgeben gegenüber Gleichaltrigen.
Lions Quest "Erwachsen werden" wurde in Österreich quasi-experimentell evaluiert (Matischek-Jauk et al., 2017) – mit instruktivem Befund: Die Effektrichtung hängt von der Umsetzungsgüte ab. Bei niedriger Programmtreue schadet das Programm tendenziell, bei mittlerer und hoher Treue verbessert es das Klassenklima und reduziert Mobbing. Verstetigung ohne Programmtreue ist also nicht neutral, sondern kann iatrogen wirken.
Ältere Programme wie Faustlos (Bowi et al., 2008) und neuere wie Papilio-U3 (Ortelbach et al., 2023) liefern weitere Evidenz mit kleineren Stichproben. Das Bild ist heterogen, aber konsistent in einem Punkt: Effekte sind klein bis moderat, kontextabhängig und ohne fortlaufende Trägerstruktur kaum stabil.
Auf der Systemebene formulieren Bittlingmayer und Okcu (2022) eine bildungssoziologische Kritik: Die Schule sei als Setting der Gesundheitsförderung strukturell überfordert, weil Hierarchie, Selektion und Leistungslogik den lebenskompetenzorientierten Programmen zuwiderlaufen. Dadaczynski et al. (2022) ziehen für die schulische Gesundheitsförderung in Deutschland nüchterne Bilanz: Die Evidenzbasis ganzheitlicher Setting-Ansätze ist schwach, der Umsetzungsstand kaum systematisch erfasst. Müller et al. (2022) zeigen für die kommunale Bewegungsförderung, dass Verstetigung regelhaft an einzelnen "Kümmerern" hängt, weil sie keine kommunale Pflichtaufgabe ist.
In Summe: Die deutschsprachige Empirie belegt die Wirksamkeit punktueller Programme. Strukturell fehlt eine systematische Längsschnittstudie, die Programme über fünf oder mehr Jahre nach Förderende verfolgt; belastbare Kosten-Nutzen-Analysen für deutsche Präventionsprogramme liegen ebenfalls nicht vor. Diese Leerstellen lassen sich durch den Bildungs-Transfer nur teilweise füllen – mit den im Folgenden diskutierten Grenzen.
Bildung und Prävention: Überlappung im Schulsetting, eigene Logik im kommunalen Raum
Schulische Prävention und Bildungsinnovation sind keine zwei Welten, die gelegentlich überlappen, sondern dasselbe Geschehen unter zwei Beschreibungen. Wer Klasse2000 in einer Grundschule verstetigen will, arbeitet mit derselben Schulleitung, demselben Kollegium, derselben Stundentafel und denselben Verteilungs- und Karrierestrukturen wie ein Mathematik-Curriculum-Pilot. Die Befunde aus Prenger et al. (2022) zu organisationalen Merkmalen, Führung, Innovations-Eigenschaften und individuellen Voraussetzungen greifen für schulbasierte Suchtprävention direkt – sie decken sich zudem in den meisten Domänen mit den Rahmenmodellen von Schell et al. (2013) und Wiltsey Stirman et al. (2012).
Eigene Konturen gewinnt die gesundheitsbezogene Implementationsforschung dort, wo Prävention die Schule verlässt. Drei Strukturmerkmale unterscheiden den außerschulischen Raum systematisch.
Erstens die Adressatenstruktur: Schulen erreichen verlässlich eine Pflichtpopulation. Kommunale Präventionsbündnisse, Suchthilfe-Netzwerke und Jugendhilfe-Angebote müssen ihre Zielgruppe aktiv ansprechen und Inanspruchnahmehürden überwinden. Reichweite ist hier ein eigenständiges Problem, im Schulsetting weitgehend gegeben.
Zweitens die Trägerstruktur: Schulen sind staatlich finanziert und langfristig stabil – schulbasierte Programme können auf dieser Trägerstabilität aufsetzen. Außerschulische Präventionsangebote leben überwiegend aus Projektmitteln, von Sozialversicherungsträgern oder Stiftungen mit Förderhorizonten von zwei bis fünf Jahren. Schell et al. (2013) gewichten Finanzierungsstabilität deshalb als eigenständige Domäne; Prenger et al. (2022) thematisieren Finanzierung kaum, weil sie für die schulische Innenperspektive nachrangig ist.
Drittens die Wirkungsmessung: Bildungsinnovationen werden an Schulleistung, Klassenklima und Unterrichtsqualität gemessen; gesundheitsbezogene Programme zusätzlich an Inzidenz und Prävalenz, an Mediationspfaden über Lebenskompetenz, Selbstwirksamkeit oder soziale Normen. Schulbasierte Suchtprävention liegt methodisch zwischen beidem – und muss in der Evaluation entsprechend doppelt aufgestellt sein.
Präziser gefasst: Der Bildungs-Review liefert für schulbasierte Prävention ein direkt einsetzbares Faktorraster auf Mikro- und Mesoebene. Für kommunale, sektorenübergreifende und außerschulische Präventionsstrukturen sind ergänzend die Rahmenmodelle von Schell, Wiltsey Stirman und Damschroder heranzuziehen, weil sie genau jene Makroebene – Politik, Finanzierung, Reichweite – stärker gewichten, die im Schulkontext durch die Pflichtinstitution abgedeckt ist.
Synthese
Nachhaltigkeit ist kein Nebenprodukt guter Umsetzung. Sie ist ein eigenständiges Ergebnis mit eigenen Determinanten. Wer sie planen will, plant auf vier Ebenen zugleich: politische Verankerung, Trägerkapazität, Innovationsgestaltung und Engagement der Umsetzenden. Die Implementationsforschung liefert dafür belastbare Werkzeuge: das PSAT zur Selbstdiagnose, das CFIR zur Determinantenanalyse, das RE-AIM zur Wirkungsbreite.
Welche dieser Werkzeuge im Vordergrund stehen, hängt vom Setting ab. Für schulbasierte Programme – die den größten empirisch belegten Anteil deutschsprachiger Prävention bilden – liegt der Hebel auf den bildungswissenschaftlich bekannten Faktoren: Curriculum-Verträglichkeit, Rückendeckung der Schulleitung, Fortbildungs- und Vertretungslogik, Anpassbarkeit an die einzelne Klasse. Das Verstetigungsmodell von Prenger et al. (2022) bildet diese Innen-Perspektive direkt ab. Für außerschulische Prävention – kommunale Bündnisse, Suchthilfe, Jugendhilfe, Frühe Hilfen – schiebt sich die Makroebene nach vorne: stabile Mehrjahresfinanzierung, ressortübergreifende Trägerstrukturen, aufsuchende Reichweite. Hier sind Schell et al. (2013), Wiltsey Stirman et al. (2012) und Damschroder et al. (2022) die schärferen Instrumente.
Vollständige Verstetigung ist die Ausnahme. Programme, die sie schaffen, tun es selten unverändert: Sie leben von Anpassung, von Schlüsselpersonen, von kontinuierlicher Wirkungsbeobachtung und davon, dass jemand sie bezahlt. Verschwinden Programme, ist das selten ein Versagen der Beteiligten, sondern ein Strukturproblem – nicht weniger schmerzhaft für die Zielgruppe, der sie nicht mehr zur Verfügung stehen.
Limitationen
Die hier zitierte Literatur stammt überwiegend aus dem angelsächsischen Sprachraum. Effektgrößen sind dort konsistent dokumentiert, lassen sich aber nicht eins zu eins auf deutsche Kontexte übertragen – die australische CTC-Replikation (Abimanyi-Ochom et al., 2024) erzielte deutlich kleinere Renditen als die US-Originale.
Eine Verzerrung durch unvollständige Veröffentlichung ist plausibel: Programme, die nicht verstetigt wurden, generieren seltener Publikationen. Wiltsey Stirman et al. (2012) und Shelton et al. (2018) thematisieren das, ohne es methodisch auflösen zu können.
Die Definitionsuneinheit bleibt erheblich (Moore et al., 2017); Studienvergleiche stehen unter Vorbehalt. Für den deutschsprachigen Raum fehlen systematische Längsschnittstudien, die Programme über mehrere Jahre nach Förderende beobachten.
Aspekte der Versorgungsgerechtigkeit (Migration, soziale Lage, regionale Unterschiede) werden erst seit wenigen Jahren systematisch mitbedacht (Damschroder et al., 2022). Empirische Befunde zur Verstetigung von Präventionsprogrammen für benachteiligte Zielgruppen sind weiterhin lückenhaft.
Schluss
Verstetigung ist eine Verteilungsfrage. Wenn ein wirksames Programm nach drei Jahren endet, verschwindet die Ressource zuerst dort, wo sie ohnehin schwerer zugänglich war: in armen Kommunen, an unterausgestatteten Schulen, bei Trägern ohne Drittmittelkapazität. Das ist die ethische Pointe der Nachhaltigkeitsdebatte – nicht primär eine Frage wirtschaftlicher Effizienz, sondern gerechter Versorgung. Sie schließt an die Forschung zu sozialen Determinanten der Gesundheit an (Marmot, 2005): Gesundheitliche Chancen verteilen sich entlang sozialer Gradienten, und Programme, die nicht verstetigt werden, ziehen sich aus diesen Gradienten zuerst zurück.
Aus der Empirie folgt keine einfache Handlungsanweisung. Programme verstetigen sich nicht, weil ihre Umsetzenden es wollen, sondern weil äußere Strukturen, innere Kapazitäten, Programmgestaltung und Praxis zusammenpassen. Fehlt eine Ebene, kollabiert der Rest mit. Das ist eine anspruchsvolle Erkenntnis und verträgt sich schlecht mit der Vorstellung, gute Absicht und ein passendes Curriculum reichten aus.
Die Aufgabe für Träger, Geldgeber und Politik ist demnach weniger, neue Programme zu starten, als bestehende so auszustatten, dass sie über den ersten Förderzyklus hinaus überleben. Das ist die unspektakuläre Form von Innovation, die in der Präventionspraxis am häufigsten unterschätzt wird.
Literaturverzeichnis
Abimanyi-Ochom, J., Wanni Arachchige Dona, S., Bohingamu Mudiyanselage, S., Toumbourou, J. W., Hawkins, J. D., Catalano, R. F., Kuklinski, M. R., & Le, L. K. (2024). Australian Communities That Care (CTC) intervention: Benefit-cost analysis of a community-based youth alcohol prevention initiative. PLOS ONE, 19(11), e0314153. https://doi.org/10.1371/journal.pone.0314153
Bertram, R. M., Blase, K. A., & Fixsen, D. L. (2014). Improving programs and outcomes: Implementation frameworks and organization change. Research on Social Work Practice, 25(4), 477 – 487. https://doi.org/10.1177/1049731514537687
Bittlingmayer, U. H., & Okcu, G. (2022). School from the spirit of public health? Bundesgesundheitsblatt, 65(7 – 8), 768 – 775. https://doi.org/10.1007/s00103-022-03547-6
Bowi, U., Ott, G., & Tress, W. (2008). Faustlos – Gewaltprävention in der Grundschule. Praxis der Kinderpsychologie und Kinderpsychiatrie, 57(7), 509 – 520. https://doi.org/10.13109/prkk.2008.57.7.509
Brown, L. D., Feinberg, M. E., & Greenberg, M. T. (2010). Determinants of community coalition ability to support evidence-based programs. Prevention Science, 11(3), 287 – 297. https://doi.org/10.1007/s11121-010-0173-6
Dadaczynski, K., Okan, O., & De Bock, F. (2022). Schulische Gesundheitsförderung und Prävention in Deutschland. Aktuelle Themen, Umsetzung und Herausforderungen. Bundesgesundheitsblatt, 65(7 – 8), 737 – 740. https://doi.org/10.1007/s00103-022-03558-3
Damschroder, L. J., Reardon, C. M., Opra Widerquist, M. A., & Lowery, J. (2022). The updated Consolidated Framework for Implementation Research based on user feedback. Implementation Science, 17(1), 75. https://doi.org/10.1186/s13012-022-01245-0
Fagan, A. A., Bumbarger, B. K., Barth, R. P., Bradshaw, C. P., Cooper, B. R., Supplee, L. H., & Walker, D. K. (2019). Scaling up evidence-based interventions in US public systems to prevent behavioral health problems: Challenges and opportunities. Prevention Science, 20(8), 1147 – 1168. https://doi.org/10.1007/s11121-019-01048-8
Faggiano, F., Minozzi, S., Versino, E., & Buscemi, D. (2014). Universal school-based prevention for illicit drug use. Cochrane Database of Systematic Reviews, 2014(12), CD003020. https://doi.org/10.1002/14651858.CD003020.pub3
Glasgow, R. E., Harden, S. M., Gaglio, B., Rabin, B., Smith, M. L., Porter, G. C., Ory, M. G., & Estabrooks, P. A. (2019). RE-AIM planning and evaluation framework: Adapting to new science and practice with a 20-year review. Frontiers in Public Health, 7, 64. https://doi.org/10.3389/fpubh.2019.00064
Glasgow, R. E., Vogt, T. M., & Boles, S. M. (1999). Evaluating the public health impact of health promotion interventions: The RE-AIM framework. American Journal of Public Health, 89(9), 1322 – 1327. https://doi.org/10.2105/AJPH.89.9.1322
Greenhalgh, T., Robert, G., Macfarlane, F., Bate, P., & Kyriakidou, O. (2004). Diffusion of innovations in service organizations: Systematic review and recommendations. Milbank Quarterly, 82(4), 581 – 629. https://doi.org/10.1111/j.0887-378X.2004.00325.x
Greenhalgh, T., Wherton, J., Papoutsi, C., Lynch, J., Hughes, G., A'Court, C., Hinder, S., Fahy, N., Procter, R., & Shaw, S. (2017). Beyond adoption: A new framework for theorizing and evaluating nonadoption, abandonment, and challenges to the scale-up, spread, and sustainability of health and care technologies. Journal of Medical Internet Research, 19(11), e367. https://doi.org/10.2196/jmir.8775
Hansen, J., Hanewinkel, R., Maruska, K., & Isensee, B. (2011). The 'Eigenständig werden' prevention trial: A cluster randomised controlled study on a school-based life skills programme to prevent substance use onset. BMJ Open, 1(2), e000352. https://doi.org/10.1136/bmjopen-2011-000352
Hawkins, J. D., Oesterle, S., Brown, E. C., Abbott, R. D., & Catalano, R. F. (2014). Youth problem behaviors 8 years after implementing the Communities That Care prevention system: A community-randomized trial. JAMA Pediatrics, 168(2), 122 – 129. https://doi.org/10.1001/jamapediatrics.2013.4009
Hawkins, J. D., Oesterle, S., Brown, E. C., Arthur, M. W., Abbott, R. D., Fagan, A. A., & Catalano, R. F. (2009). Results of a type 2 translational research trial to prevent adolescent drug use and delinquency. Archives of Pediatrics and Adolescent Medicine, 163(9), 789 – 798. https://doi.org/10.1001/archpediatrics.2009.141
Isensee, B., & Hanewinkel, R. (2009). Effekte des Unterrichtsprogramms "Klasse2000": Ergebnisse einer vierjährigen Kontrollgruppenstudie in Hessen. Suchttherapie, 10(S 01), 36. https://doi.org/10.1055/s-0029-1240422
Kliem, S., Krieg, Y., Lohmann, A., Lührs, F., Müller, K., & Beckmann, L. (2020). Evaluation of the universal prevention program Klasse2000 in fourth grade primary school children: Protocol for a propensity score-matching approach. JMIR Research Protocols, 9(8), e14371. https://doi.org/10.2196/14371
Kuklinski, M. R., Briney, J. S., Hawkins, J. D., & Catalano, R. F. (2012). Cost-benefit analysis of Communities That Care outcomes at eighth grade. Prevention Science, 13(2), 150 – 161. https://doi.org/10.1007/s11121-011-0259-9
Kuklinski, M. R., Fagan, A. A., Hawkins, J. D., Briney, J. S., & Catalano, R. F. (2015). Benefit-cost analysis of a randomized evaluation of Communities That Care: Monetizing intervention effects on the initiation of delinquency and substance use through grade 12. Journal of Experimental Criminology, 11(2), 165 – 192. https://doi.org/10.1007/s11292-014-9226-3
Luke, D. A., Calhoun, A., Robichaux, C. B., Elliott, M. B., & Moreland-Russell, S. (2014). The Program Sustainability Assessment Tool: A new instrument for public health programs. Preventing Chronic Disease, 11, 130184. https://doi.org/10.5888/pcd11.130184
Marmot, M. (2005). Social determinants of health inequalities. The Lancet, 365(9464), 1099 – 1104. https://doi.org/10.1016/S0140-6736(05)71146-6
Matischek-Jauk, M., Krammer, G., & Reicher, H. (2017). The life-skills program Lions Quest in Austrian schools: Implementation and outcomes. Health Promotion International, 33(6), 1022 – 1032. https://doi.org/10.1093/heapro/dax050
May, C. (2013). Towards a general theory of implementation. Implementation Science, 8(1), 18. https://doi.org/10.1186/1748-5908-8-18
Moore, J. E., Mascarenhas, A., Bain, J., & Straus, S. E. (2017). Developing a comprehensive definition of sustainability. Implementation Science, 12(1), 110. https://doi.org/10.1186/s13012-017-0637-1
Müller, C., Paulsen, L., & Bucksch, J. (2022). Bewegungs- und Gesundheitsförderung in ländlichen und städtischen Kommunen – eine qualitative Analyse zu den Rollen potenzieller Multiplikatoren. Prävention und Gesundheitsförderung, 18(3), 397 – 404. https://doi.org/10.1007/s11553-022-00975-9
Ortelbach, N., Bovenschen, I., Gerlach, J., Bohlen, M., Heinrichs, N., Hahlweg, K., Mayer, H., Petermann, F., & Spangler, G. (2023). Design, implementation, and evaluation of a preventive intervention program to foster social-emotional development and attachment security of toddlers in early childhood education and care: The Papilio-U3 program. International Journal of Developmental Science, 16(3 – 4), 63 – 79. https://doi.org/10.3233/dev-220336
Prenger, R., Tappel, A. P. M., Poortman, C. L., & Schildkamp, K. (2022). How can educational innovations become sustainable? A review of the empirical literature. Frontiers in Education, 7, 970715. https://doi.org/10.3389/feduc.2022.970715
Proctor, E., Silmere, H., Raghavan, R., Hovmand, P., Aarons, G., Bunger, A., Griffey, R., & Hensley, M. (2011). Outcomes for implementation research: Conceptual distinctions, measurement challenges, and a research agenda. Administration and Policy in Mental Health and Mental Health Services Research, 38(2), 65 – 76. https://doi.org/10.1007/s10488-010-0319-7
Scheirer, M. A. (2005). Is sustainability possible? A review and commentary on empirical studies of program sustainability. American Journal of Evaluation, 26(3), 320 – 347. https://doi.org/10.1177/1098214005278752
Scheirer, M. A., & Dearing, J. W. (2011). An agenda for research on the sustainability of public health programs. American Journal of Public Health, 101(11), 2059 – 2067. https://doi.org/10.2105/AJPH.2011.300193
Schell, S. F., Luke, D. A., Schooley, M. W., Elliott, M. B., Herbers, S. H., Mueller, N. B., & Bunger, A. C. (2013). Public health program capacity for sustainability: A new framework. Implementation Science, 8(1), 15. https://doi.org/10.1186/1748-5908-8-15
Shelton, R. C., Cooper, B. R., & Wiltsey Stirman, S. (2018). The sustainability of evidence-based interventions and practices in public health and health care. Annual Review of Public Health, 39(1), 55 – 76. https://doi.org/10.1146/annurev-publhealth-040617-014731
Spaeth, M., Weichold, K., & Silbereisen, R. K. (2010). Examining the differential effectiveness of a life skills program (IPSY) on alcohol use trajectories in early adolescence. Journal of Consulting and Clinical Psychology, 78(3), 334 – 348. https://doi.org/10.1037/a0019550
Weichold, K., Tomasik, M. J., & Silbereisen, R. K. (2016). The effectiveness of the life skills program IPSY for the prevention of adolescent tobacco use. Journal of Early Adolescence, 36(7), 881 – 908. https://doi.org/10.1177/0272431615589349
Wiltsey Stirman, S., Kimberly, J., Cook, N., Calloway, A., Castro, F., & Charns, M. (2012). The sustainability of new programs and innovations: A review of the empirical literature and recommendations for future research. Implementation Science, 7(1), 17. https://doi.org/10.1186/1748-5908-7-17