Prävention

Evidenzbasiertes prosoziales Handeln: Was Toumbourous Konzept leistet – und wo es seine Grenzen hat

Veröffentlicht
Aktualisiert
Lesezeit
~ 36 min
Inhaltsverzeichnis
  1. Einleitung: Eine Klassenraumszene
  2. Theoretische Verortung und epistemische Dimension
  3. Säule 1 – Wirkungswissen als Verpflichtung
  4. Säule 2 – Soziales Entwicklungsmodell und das Seattle Social Development Project
  5. Säule 3 – Communities That Care: Wirksamkeit, Grenzen, deutsche Adaption
  6. Säule 4 – Bindungen zu Fremdgruppen: Intergruppenkontakt seit Allport
  7. Säule 5 – Wenn Prävention schadet: iatrogene Effekte und ihre Mechanismen
  8. Säule 6 – Positive Psychologie und ihre Lücken
  9. Säule 7 – Freiheit, Wohlfahrt, Menschenrechte
  10. Säule 8 – Fachkräftebasis, EUPC und Professionalisierung
  11. Vergleichstabelle der acht Säulen
  12. Übertragbarkeit: DACH-Spezifika, Migration, Kosten
  13. Synthese: Fünf Konvergenzlinien
  14. Praxis-Box nach Ausgangslage
  15. Limitationen
  16. Schluss
  17. Literaturverzeichnis

Einleitung: Eine Klassenraumszene

Eine sechste Klasse in einer mittleren Großstadt. Eine Polizeibeamtin steht vorne und erklärt, warum Drogen schlecht sind. Sie meint es ernst. Die Schule ist froh, dass sich jemand kümmert. Die Eltern fühlen sich beruhigt. Die Schüler hören zu. Vier Jahre später haben jene Kinder, die das Programm durchlaufen haben, geringfügig häufiger Cannabis probiert als diejenigen, die es nicht durchlaufen haben. Die Differenz ist klein. Sie ist statistisch nicht immer signifikant. Aber sie geht in die falsche Richtung.

Diese Szene beschreibt keinen Einzelfall. Sie beschreibt das amerikanische Project DARE (Drug Abuse Resistance Education), das in den 1980er- und 1990er-Jahren in zahlreichen US-Schuldistrikten flächendeckend eingeführt wurde – bevor systematische Wirksamkeitsstudien (Ringwalt et al., 1991) zeigten, dass das Programm seine Ziele verfehlte. Es beschreibt das australische Life-Education-Programm, das nach einer Re-Analyse durch Hawthorne (1996) statistisch eher mit erhöhtem Konsum bei beteiligten Schülerinnen und Schülern korrelierte als mit reduziertem.

Solche Befunde sind der Anlass für Toumbourous theoretischen Versuch. Der australische Präventionsforscher John W. Toumbourou hat 2016 unter dem Titel Beneficial Action within Altruistic and Prosocial Behavior in der Zeitschrift Review of General Psychology einen Begriff eingeführt, den die deutschsprachige Rezeption mit „evidenzbasiertem prosozialem Handeln" wiedergibt. Sein Vorschlag ist im Kern eine Pflichtsetzung: Wer prosozial handeln will, muss die Folgen seines Handelns kennen wollen. Wer sie nicht kennen kann, muss es sagen. Wer sie kennt und gegen sie handelt, handelt nicht prosozial, sondern nur gut gemeint.

Dieser Beitrag prüft Toumbourous Konzept entlang dessen, was die empirische Forschung seit 2016 dazu beigesteuert hat. Er nimmt vier seiner Säulen auf – Freiheit, Wirkungswissen, soziale Bindungen, prosoziale Handlungspraxis – und ergänzt sie um vier weitere, die für die Präventionsarbeit im deutschsprachigen Raum unverzichtbar sind: iatrogene Effekte, positive Psychologie, der politisch-ökonomische Hintergrund und die Frage, wer im DACH-Raum eigentlich prosoziales Handeln professionell ausüben können soll.

Theoretische Verortung und epistemische Dimension

Toumbourous (2016) Beneficial Action Theory formuliert vier Prinzipien:

  1. Freiheit als Bereich an Verhalten, den ein Organismus wählen und ausführen kann, nachdem genetische und umweltbedingte Determinanten berücksichtigt wurden (S. 248).
  2. Evidenzbasiertes prosoziales Handeln als prosozial und altruistisch motiviertes Verhalten, das Wirkungswissen nutzt, um die Freiheit innerhalb der globalen Bevölkerung zu erhöhen (S. 248).
  3. Wirkungswissen als ein primäres Mittel, durch das Organismen lernen, individuelle Freiheit einzuschränken, um Freiheit auf Bevölkerungsebene zu erhöhen (S. 249).
  4. Soziale Bindungen zu Fremdgruppen als Voraussetzung für die Ausweitung fürsorglichen Handelns über die eigene Gruppe hinaus (S. 251).

Was an dieser Theorie neu ist, ist die explizite Verknüpfung dreier Felder, die in der psychologischen Literatur in der Regel getrennt verhandelt werden: prosoziale Motivation, wissenschaftliche Evidenzproduktion und globale Verteilungsgerechtigkeit. Toumbourou benennt damit eine Spannung, die in der Präventionsforschung selten ausgesprochen wird: Wer ein Programm gut findet, weil es ihm gefällt, handelt nicht zwingend prosozial. Erst die Bereitschaft, das eigene Programm einer Wirksamkeitsprüfung auszusetzen und es bei negativem Befund einzustellen, qualifiziert das Handeln moralisch.

Was an dieser Theorie unscharf bleibt, ist mindestens dreierlei. Erstens lässt sich der Begriff „globale Bevölkerung" empirisch nicht operationalisieren – Toumbourou schlägt einen Index menschlicher Freiheit aus fünf Komponenten vor (Lebensdauer, positive psychische Gesundheit, ökonomische Freiheit, Menschenrechte, Talententfaltung), aber diese Komponenten ziehen ihre Validität aus heterogenen Quellen, die sich teils widersprechen. Zweitens definiert Toumbourou „Wirkungswissen" so weit, dass auch nicht-randomisierte Befunde, ökonomische Modellrechnungen und Cochrane-Reviews unter denselben Begriff fallen – damit verschleifen sich Evidenzklassen, die methodologisch sehr unterschiedlich belastbar sind. Drittens bleibt offen, ob Beneficial Action ein deskriptives Konstrukt sein soll (das Verhalten von Personen beschreibt) oder ein normatives (das Verhalten fordert).

Diese Unschärfen sind der Grund dafür, dass Toumbourous Konzept in der internationalen Forschungsliteratur seit 2016 zwar zitiert, aber kaum als eigenständige Hypothese empirisch geprüft wurde. Die Smart-Citation-Auswertung (Scite) zeigt für Toumbourou (2016) 18 Zitationen, davon zwei stützend, 16 lediglich erwähnend und keine widersprechend – ein Profil, das auf ein Konzept hinweist, das als Begründungsfigur genutzt wird, nicht als Forschungsgegenstand. Für eine Theorie, die seit fast einem Jahrzehnt im Raum steht, ist das eine bemerkenswerte Leerstelle.

In der Logik der Wissenschaftstheorie ist Toumbourous Beitrag damit am ehesten ein theoretisches Programm im Sinne von Lakatos: Er bietet einen Rahmen, mit dem sich Forschungsfragen stellen lassen, aber er ist selbst nicht das Ergebnis einer Forschung, sondern deren Vorbereitung. Genau so sollte er rezipiert werden.

Säule 1 – Wirkungswissen als Verpflichtung

Toumbourous drittes Prinzip – die Systematisierung von Wirkungswissen erhöht Freiheit – ist epistemologisch nicht neu. Es ist die Übertragung einer Idee, die in der Medizin seit Mitte der 1990er Jahre als „evidence-based medicine" etabliert ist, auf das Feld der Präventionspolitik. Das ist legitim, aber es lohnt sich, die Übertragungsmühe zu benennen.

In der Medizin lassen sich Wirkungen von Medikamenten in randomisierten kontrollierten Studien (RCTs) mit hohen statistischen Power-Werten und klar definierten Zielgrößen prüfen (Sackett et al., 1996). In der Präventionspolitik ist die Lage komplizierter: Bevölkerungen lassen sich nicht doppelblind verabreichen, Wirkkomponenten greifen oft erst nach Jahren, Effektgrößen sind klein, Heterogenität zwischen Subgruppen ist groß, und die Ergebnisse hängen massiv vom Implementationsgrad ab.

Drei institutionelle Antworten auf diese Schwierigkeit sind für Toumbourous Argument zentral:

Cochrane Collaboration. Cochrane bündelt seit 1993 systematische Übersichtsarbeiten klinischer Forschung. Die Methodik ist streng (PRISMA, GRADE), die Ergebnisse sind frei zugänglich. Übertragen auf die Präventionsforschung bedeutet das: Eine Maßnahme gilt nur dann als evidenzbasiert, wenn sie eine systematische Wirksamkeitsprüfung mit präregistrierten Ergebnisindikatoren überstanden hat – nicht, wenn sie plausibel klingt.

Washington State Institute for Public Policy (WSIPP). Aos und Kollegen (2011) hatten in ihrem Bericht Return on Investment erstmals systematisch Kosten-Nutzen-Verhältnisse evidenzbasierter Programme berechnet. Die Methodik wurde seither weiterentwickelt; Kuklinski und Kollegen (2015) berichten für CTC einen Nutzen-Kosten-Faktor von 8,22 zu 1 bei einer internen Verzinsung von 21 Prozent (Modellrechnung über den Outcome-Horizont bis Klasse 12 zuzüglich modellierter Folgewerte; Investment innerhalb von neun Jahren refinanziert). Solche Werte sind beeindruckend, aber sie beruhen auf US-spezifischen Kostenstrukturen für Strafvollzug, Gesundheitsversorgung und Steuersystem. Eine 1:1-Übertragung in den deutschsprachigen Raum ist nicht möglich.

Grüne Liste Prävention (GLP). Die GLP wurde 2011 unter Federführung des Landespräventionsrats Niedersachsen und der Medizinischen Hochschule Hannover etabliert (Bremer, Brender, & Groeger-Roth, 2022). Sie ist Deutschlands einziges öffentlich zugängliches Register evidenzbasierter Präventionsprogramme. In einer aktuellen systematischen Auswertung dokumentieren Brender und Kollegen (2024), dass die Liste 102 Programme umfasst (Stand 02/2024), wobei „Verhaltenspräventive Programme zu den Themen Gewalt (inkl. Mobbing) (63,7 %), Sucht (46,1 %) und/oder psychische Gesundheit (35,3 %) […] häufig vertreten" sind, während Programme zu Ernährung und/oder Bewegung mit 4,9 Prozent „kaum repräsentiert sind" (Brender et al., 2024). Die Lückenanalyse ist ein wichtiger Befund: Wirkungswissen liegt in Deutschland themenungleich verteilt vor.

Bremer, Brender und Groeger-Roth (2024) verweisen darauf, dass mittlerweile 106 Programme für die psychosoziale Gesundheit von Kindern und Jugendlichen beschrieben sind. Die GLP orientiert sich am Vorbild des US-amerikanischen Blueprints-Programms des Center for the Study and Prevention of Violence der University of Colorado, passt diesen Rahmen aber an deutsche Förder- und Umsetzungsstrukturen an.

Die Einordnung dieser drei Institutionen in Toumbourous Rahmen lautet: Sie sind notwendige, aber nicht hinreichende Voraussetzungen für evidenzbasiertes prosoziales Handeln. Notwendig, weil ohne sie keine systematische Aggregation von Wirkungswissen erfolgt. Nicht hinreichend, weil ein Programm, das in der GLP gelistet ist, nicht automatisch in jedem Kontext und für jede Zielgruppe wirksam ist. Wirkungswissen ist Kontextwissen.

Säule 2 – Soziales Entwicklungsmodell und das Seattle Social Development Project

Das Soziale Entwicklungsmodell (Social Development Model, SDM) wurde von Catalano und Hawkins (1996) als entwicklungspsychologische Theorie für die Erklärung sowohl prosozialer als auch antisozialer Verhaltensbahnen formuliert. Kerngedanke: Verhalten entsteht aus dem Zusammenspiel von Lerngelegenheiten, individuellen Fertigkeiten, daraus resultierender Beteiligung, daraus resultierender Anerkennung und schließlich daraus resultierenden Bindungen an konventionelle bzw. abweichende Bezugsgruppen. Wer in der Familie und Schule Anerkennung für prosoziales Verhalten erfährt, bindet sich stärker an konventionelle Normen – mit der Folge, dass abweichendes Verhalten subjektiv kostspieliger wird.

Das SDM ist eine der am besten geprüften Theorien in der Präventionsforschung. Die längste empirische Erprobung erfolgte im Seattle Social Development Project (SSDP), einem nichtrandomisierten kontrollierten Feldversuch, der 1981 in Seattler Schulen mit hoher Kriminalitätsbelastung begann.

Die Befunde sind komplex und verdienen differenzierte Darstellung:

Adoleszenz (Hawkins et al., 1999). Die Studie verfolgte 643 Schülerinnen und Schüler bis zum Alter von 18 Jahren. Die Vollintervention (Klassen 1 – 6, mit Lehrkräftefortbildung, Elternkursen und Sozialkompetenztraining für Kinder) reduzierte gegenüber der Kontrollgruppe selbstberichtete Gewalttaten, schwerwiegende Schulvergehen und gemischten Alkoholkonsum. Effekte auf Drogenkonsum waren weniger eindeutig.

Frühes Erwachsenenalter (Hawkins et al., 2005). Im Alter von 21 Jahren zeigten die Vollintervention-Probanden bessere allgemeine Lebensführung, höhere Bindung an Schule und Beruf sowie weniger psychische Beeinträchtigungen. Die Autoren interpretieren das als Beleg für Mediationseffekte des SDM: Die Intervention wirkte über die postulierten Bindungs- und Anerkennungsmechanismen.

Mittleres Erwachsenenalter (Hill et al., 2025). Die jüngste Auswertung mit Daten bis zum Alter von 39 Jahren ist methodologisch besonders bemerkenswert. Hill und Kollegen (2025) berichten signifikant niedrigere Werte für Suizidgedanken und -verhalten, Depression, generalisierte Angststörung, posttraumatische Belastungsstörung und soziale Phobie in der Interventionsgruppe gegenüber der Kontrollgruppe (n = 156 Intervention vs. n = 220 Kontrolle, sechs Erhebungswellen über die Altersspanne 21 – 39). Verbatim aus dem Abstract: „Universal childhood preventive intervention can reduce suicide ideation and behaviors and related mental health problems in adulthood" (Hill et al., 2025). Die Studie ist registriert (ClinicalTrials.gov NCT04075019) und nutzt DSM-IV-basierte Kriterienzählungen.

Eine wichtige Differenzierung liefern Steiner, Sheremenko und Kollegen (2019, Pediatrics). Sie analysierten die Add-Health-Daten und fanden langfristige schulisch-familiäre Bindungseffekte auf eine breite Palette an Erwachsenen-Outcomes (psychische Gesundheit, Gewalt, sexuelle Gesundheit und Substanzkonsum). In der Diskussion benennen sie eine Diskrepanz zu früheren SSDP-Befunden: „long-term associations with substance use were null, which is inconsistent with our study, perhaps because we used discrete indicators rather than a substance use index" (Steiner et al., 2019). Auf SSDP bezogen heißt das: Die ursprünglichen Substanzkonsumeffekte des SSDP halten in als Index aggregierten Langzeitanalysen nicht durchgängig, während getrennt erfasste Indikatoren (Steiner-Studie) durchaus Effekte zeigen.

Diese methodologische Differenzierung ist wichtig: Wirksamkeitsbefunde sind teils Operationalisierungsartefakte. Das SDM und seine konkreten Anwendungen liefern langfristige psychische Gesundheitsgewinne; bei Substanzkonsum ist die Befundlage je nach Studie und Indikator heterogen. Das ist nicht weniger als ein Erfolg – aber es ist ein differenzierter Erfolg, der weder Heilsversprechen rechtfertigt noch pauschalen Wirksamkeitspessimismus.

Eine zusätzliche Schicht legen Kim, Gilman, Hemphill und Kollegen (2016) auf: In ihrer Auswertung der SSDP-Daten zeigten sie, dass die im SDM postulierten Schutzfaktoren selbst bei hochbelasteten Jugendlichen wirksam sind. Verbatim: Schutzfaktoren reduzierten die Wahrscheinlichkeit von Gewalt im späten Jugendalter „even among youth from low SES families and youth exposed to high levels of cumulative risk" (Kim et al., 2016). Das ist ein Befund gegen die These, evidenzbasierte Prävention helfe nur den ohnehin Privilegierten.

Säule 3 – Communities That Care: Wirksamkeit, Grenzen, deutsche Adaption

Communities That Care (CTC) ist die kommunale Übersetzung des SDM in einen Implementationsrahmen. Hawkins und Catalano entwickelten das System ab Anfang der 1990er-Jahre. Es gliedert sich in fünf Phasen: Aufbau lokaler Bündnisse, Bedarfsanalyse anhand validierter Schüler-Surveys, Auswahl evidenzbasierter Programme aus einem Katalog, Umsetzung mit Fidelitätssicherung, Auswertung und Anpassung. CTC ist also kein einzelnes Programm, sondern ein Rahmen, der Kommunen dabei unterstützt, evidenzbasierte Programme entlang ihres jeweiligen Risikoprofils auszuwählen und umzusetzen.

Wirksamkeitsbefunde

Die Evidenz stützt sich vor allem auf zwei Studienlinien:

Community Youth Development Study (CYDS). Diese cluster-randomisierte Studie verglich 24 Kommunen in sieben US-Bundesstaaten (12 CTC, 12 Kontrolle), die ein Panel von 4.407 Schülerinnen und Schülern ab Klasse 5 jährlich befragten. Hawkins, Oesterle, Brown und Kollegen (2009) berichteten in der zentralen Wirksamkeitsauswertung verbatim: „The incidences of alcohol, cigarette and smokeless tobacco initiation, and delinquent behavior were significantly lower in CTC than in control communities for students in grades 5 through 8" (Hawkins et al., 2009). Die für unsere Fragestellung wichtigste Folgeauswertung stammt von Oesterle, Hawkins und Kuklinski (2015).

Oesterle et al. (2015) – Differenzierte Befunde nach Geschlecht und Ergebnisklasse. Im Alter von 19 Jahren – also neun Jahre nach Studienbeginn und sechs Jahre nach Ende der Förderung – zeigten sich folgende Befunde (verbatim): „CTC had a significant overall effect across lifetime measures of the primary outcomes for males, but not for females or the full sample" (Oesterle et al., 2015). Die Lebenszeitprävalenz von Delinquenz war in CTC-Kommunen signifikant niedriger (ARR = 1,16); männliche CTC-Probanden zeigten höhere Lebenszeitabstinenz vom Zigarettenrauchen (ARR = 1,22). Aber: „CTC did not have a sustained effect on current substance use and delinquency nor did it improve the secondary outcomes at age 19 for either gender" (Oesterle et al., 2015). Die Effekte auf depressive Symptomatik, Suizidalität, Bildungsabschluss und sexuelles Risikoverhalten waren bei 19-Jährigen nicht mehr nachweisbar.

Die Autorinnen und Autoren ziehen einen seriösen Schluss: „Communities using CTC may need to extend their prevention planning to include the high school years to sustain effects on drug use and delinquency beyond high school for both genders" (Oesterle et al., 2015). Anders gesagt: Eine in der Grundschulzeit angelegte Intervention erzeugt nicht automatisch Effekte, die das gesamte Erwachsenenalter überdauern. Wer das glaubt, glaubt zu viel.

Australische Replikation (Toumbourou et al., 2019). In Australien wurde CTC ab 2001 eingeführt. Toumbourou, Rowland, Williams und Kollegen (2019) werteten Selbstauskunftsdaten von 41.328 Jugendlichen (Durchschnittsalter 13,5 Jahre) zwischen 1999 und 2015 aus 109 Kommunalbezirken aus, von denen fünf Bezirke mit vier abgeschlossenen CTC-Bündnissen verglichen wurden mit den restlichen 104. Verbatim aus dem Abstract: „adolescents in CTC localities reported significantly steeper annual reductions in any lifetime alcohol (Adjusted odds ratio [AOR] = 0.94, 95% confidence intervals [CI] = [0.93, 0.95]), tobacco (AOR = 0.97, CI [0.96, 0.99]), cannabis use (AOR = 0.96, CI [0.93, 0.98]) and antisocial behavior" (Toumbourou et al., 2019). Die Effekte sind klein, aber konsistent – und sie gelten in einer methodisch anderen, nicht randomisierten Studie über 16 Jahre und 41.000 Jugendliche.

Nachhaltigkeitsprobleme. Kim und Kollegen (2015) zeigten, dass die globalen Effekte von CTC auf Schutzfaktoren in Klasse 10 nicht erhalten bleiben: „Global effects of CTC on protective factors across all domains are not sustained in Grade 10. However, sustained domain-specific effects are observed in the individual domain for males, in the peer domain for females" (Kim et al., 2015). Hier zeigt sich erneut: Subgruppen-Heterogenität ist Regel, nicht Ausnahme.

Kosten-Nutzen

Kuklinski und Kollegen (2015) berechneten in einem für die deutsche Diskussion oft zitierten Modell einen Nutzen von 4.477 USD pro Jugendlichem bei Kosten von 556 USD pro Jugendlichem, also ein Nutzen-Kosten-Verhältnis von 8,22 zu 1 und eine interne Verzinsung von 21 Prozent. Die Sensitivitätsanalyse hielt selbst einer Halbierung der Effektgrößen stand. Spätere WSIPP-Updates (zitiert in Salazar et al., 2019) berichten ein konservativeres Verhältnis von 5,31 zu 1 – immer noch positiv, aber nicht so euphorisch.

Grenzen außerhalb der USA

Die Übertragbarkeit nach Lateinamerika dokumentiert Mejía-Trujillo, Pérez-Gómez und Reyes (2015) für Kolumbien. Trujillo und Cardona-Isaza (2025) zeigen dort allerdings, dass die psychometrische Faktorstruktur des CTC-Schüler-Surveys in der kolumbianischen Adaption nicht alle Optimalindizes erreicht: „the family, individual, and peer group domains did not reach the optimal indices for risk factors" (Trujillo & Cardona-Isaza, 2025). Übertragung ist nicht trivial.

Renner, Rowland und Kollegen (2024) liefern in einer australischen Längsschnittauswertung den vielleicht wichtigsten Negativbefund: Soziale Inklusion förderte den Schulabschluss bei weniger belasteten Jugendlichen, „but did not appear to influence school completion for the most vulnerable students" (Renner et al., 2024). Die Befund ist relevant, weil er die zentrale Hoffnung der Risiko-Schutzfaktor-Logik herausfordert: Genau jene Jugendlichen, die Prävention am meisten brauchen, profitieren am wenigsten von ihrem flächendeckenden Angebot. Strukturelle Ungleichheit lässt sich offenbar nicht durch Bündnisarbeit auflösen.

CTC in Deutschland

CTC wird in Deutschland seit den 2010er-Jahren erprobt, vor allem in Niedersachsen, Düsseldorf und einzelnen Kommunen Nordrhein-Westfalens (Groeger-Roth, 2024). Die erste kontrollierte Wirksamkeitsstudie ist erst 2021 angelaufen: Röding, Soellner und Reder (2021) beschreiben in ihrem Studienprotokoll ein nicht-randomisiertes Trial mit 21 CTC-Kommunen und 21 individuell gematchten Kontrollkommunen. Verbatim: „This is the first controlled study to evaluate the effectiveness of a comprehensive community prevention approach in Germany" (Röding et al., 2021).

Die Studie ist im Deutschen Klinischen Studienregister (DRKS00022819) registriert. Sie kombiniert Längsschnitt-Kohorten der Klassen 5 – 11 mit wiederholten Querschnitten und einer ökonomischen Begleitevaluation. Erwartete Effektgröße: d = 0,2, also klein. Ergebnisse stehen aus.

Die Implikation für die deutsche Praxis ist eindeutig: CTC ist im DACH-Raum ein vielversprechendes System mit dokumentierter internationaler Wirksamkeit. Es ist aber im DACH-Raum noch nicht empirisch bewährt. Diese Differenzierung ist für die Kommunikation mit Auftraggebern und Politik wichtig, weil sie zwischen seriöser und überdehnter Evidenzaussage trennt.

Säule 4 – Bindungen zu Fremdgruppen: Intergruppenkontakt seit Allport

Toumbourous viertes Prinzip – Freiheit auf Bevölkerungsebene wächst, wenn Menschen fürsorgliche Beziehungen über die eigene Gruppe hinaus aufbauen – stützt sich theoretisch auf Tajfel und Turner (1986). Die zugehörige empirische Tradition ist allerdings älter und reicht zurück auf Allport (1954) und seine Kontakt-Hypothese: Unter günstigen Bedingungen (gleicher Status, gemeinsames Ziel, Kooperation, institutionelle Unterstützung) reduziert Kontakt zwischen Gruppen wechselseitige Vorurteile.

Die Pettigrew-Tropp-Meta-Analyse und ihre Erweiterungen

Pettigrew und Tropp (2006) prüften die Hypothese in einer Meta-Analyse von 515 Studien mit 713 unabhängigen Stichproben. Sie fanden einen kleinen, aber robusten negativen Zusammenhang zwischen Kontakt und Vorurteil. Die Effekte „typically generalize to the entire outgroup, and they emerge across a broad range of outgroup targets and contact settings" (Pettigrew & Tropp, 2006). Die Meta-Analyse hat in der Folge 7.718 Smart Citations erhalten – eine Größenordnung, die nur wenige sozialpsychologische Befunde erreicht haben.

Die Replikation und Erweiterung durch Kende, Phalet, Van Den Noortgate und Kollegen (2017) ist wissenschaftshistorisch wichtig. Sie kombinierten 660 Stichproben aus 36 Ländern und replizierten den Befund: „r = −.209, df = 659, t = −89.92, p < .0001" (Kende et al., 2017). Aber sie zeigten zusätzlich einen wichtigen Moderator: „egalitarianism was related to stronger contact-prejudice associations. Cultural hierarchy values and social dominance orientation corresponded with weaker contact-prejudice associations" (Kende et al., 2017). Das heißt: In hierarchisch geprägten Gesellschaften wirkt Kontakt schwächer als in egalitärer geprägten. Damit ist die Übertragung des Befundes in DACH-Gesellschaften – die in interkultureller Forschung als moderat egalitär gelten – eher günstig, in Gesellschaften mit hoher Machtdistanz aber anspruchsvoller.

Dovidio, Love und Schellhaas (2017) ziehen 20 Jahre nach Pettigrew und Tropp eine Bilanz. Sie heben hervor, dass Kontakt zuverlässiger Vorurteile reduziert als die meisten alternativen Interventionen – mit ausdrücklicher Bezugnahme auf eine vergleichende Auswertung von Beelmann und Heinemann (2014). Das ist relevant, weil deutschsprachige Schulprogramme häufig auf Wissensvermittlung und Empathieförderung statt auf strukturierte Kontaktsituationen setzen.

Digitaler Kontakt und seine Reichweite

In der jüngsten Erweiterungslinie haben Pereira da Costa, Bierwiaczonek und Bianchi (2024) 88 Stichproben mit 9.385 Personen meta-analytisch ausgewertet und einen signifikanten Vorurteilsabbaueffekt für digitalen Intergruppenkontakt nachgewiesen (g = 0,25). Direkte digitale Kontakte zeigten größere Effekte als indirekte. Der Effekt ist deutlich kleiner als der Pettigrew-Tropp-Effekt für Face-to-Face-Kontakt (r ≈ −.21 ≈ d ≈ 0,43), aber er ist positiv – mit Implikationen für Online-Bildungsangebote und für migrationspädagogische Brücken in Zeiten räumlicher Trennung.

Nachhaltigkeitsprobleme im Feld

Wichtig ist eine Befundlage, die in der euphorischen Sekundärrezeption der Kontakthypothese oft untergeht. Pakrashi (2020) führte ein randomisiertes Feldversuch in indischen Slums durch. Hindu- und Muslim-Teilnehmende absolvierten gemeinsam ein einwöchiges Berufstraining. Verbatim: „intergroup contact reduces the prejudice […] one week after the training program finished. While we find that most of the positive effect of intergroup contact on reducing prejudice dissipates after six months, the baseline results for Hindu attitudes toward Muslims are persistent" (Pakrashi, 2020). Das ist ein klassisches Nachhaltigkeitsproblem: Effekte sind unmittelbar messbar, sechs Monate später sind sie weitgehend wieder verschwunden.

Solche Befunde sind Mahnung gegen die Annahme, einmalige Begegnungsangebote könnten dauerhafte Einstellungsänderungen erzeugen. Sie sprechen für längerfristige, strukturell verankerte Kontaktarrangements – etwa institutionalisierte Klassenpartnerschaften, fortdauernde Mentoring-Beziehungen, kontinuierliche kollegiale Zusammenarbeit. Eine Projektwoche allein wirkt selten lange.

Implikation für Toumbourous Modell

Toumbourous Annahme, soziale Bindungen zu Fremdgruppen seien ein Schlüssel zur globalen Freiheitserweiterung, ist empirisch grundsätzlich gestützt – aber mit drei wichtigen Einschränkungen: Effekte sind klein, sie sind kulturkontextsensitiv, und sie sind ohne strukturelle Verankerung nicht stabil. Wer aus Kontakthypothese und Beneficial Action Theory Politik machen will, muss Strukturen bauen, nicht Veranstaltungen.

Säule 5 – Wenn Prävention schadet: iatrogene Effekte und ihre Mechanismen

Toumbourous Argument lebt von einer Prämisse, die er selbst nur zweimal direkt belegt: dass gut gemeinte Programme auch schaden können. Diese Prämisse trägt das gesamte Modell, weil sie die Dringlichkeit von Wirkungswissen begründet. Die empirische Lage zu iatrogenen Effekten verdient deshalb eigenständige Aufmerksamkeit.

Definition und Mechanismen

Welsh, Yohros und Zane (2020) bieten in ihrer Übersichtsarbeit eine systematische Klassifikation. Iatrogene Effekte in der Präventionsforschung sind Wirkungen, die in die gegenteilige Richtung des angestrebten Ziels weisen oder neutrale Ergebnisse erzeugen, obwohl Ressourcen aufgewendet wurden. Welsh und Kollegen unterscheiden zwei Hauptmechanismen: theory failure (die zugrunde liegende Annahme über Wirkmechanismen ist falsch) und implementation failure (die Annahme stimmt, aber das Programm wird nicht hinreichend umgesetzt). Diese Differenzierung ist methodologisch wichtig – ein theory-failure-Programm sollte abgeschafft werden, ein implementation-failure-Programm sollte verbessert werden.

Klassische Negativbefunde

Project DARE. Ringwalt, Ennett und Holt (1991) zeigten in einer der ersten methodisch sauberen Auswertungen, dass DARE keine signifikanten präventiven Effekte auf späteren Substanzkonsum hatte. Spätere Meta-Analysen bestätigten den Befund. DARE wurde in den USA bis weit in die 2000er-Jahre flächendeckend eingesetzt – ein Lehrstück darüber, wie weit gut gemeinte, intuitiv plausible Programme verbreitet werden können, ohne dass sie wirken.

Life Education (Australien). Hawthorne (1996) zeigte in einer Re-Analyse von Daten aus dem Bundesstaat Victoria, dass das Life-Education-Programm in den teilnehmenden Schulen mit erhöhtem berichtetem Konsum bei Mädchen (43 Prozent attribuierbarer Risikoanteil für Rauchen) und Jungen (35 Prozent für Rauchen, 40 Prozent für Trinken) korrelierte. Verbatim: „This re-analysis showed there was no preventive effect associated with the programme, at either the school or the population level. The findings suggest that intervention programmes should be thoroughly evaluated prior to widespread implementation, and that such evaluations should include reference to the community-wide impacts of such programmes" (Hawthorne, 1996).

Gruppen- und Subgruppenphänomene

Peer-Deviancy-Training in Gruppensettings. Hogue, Henderson und Ozechowski (2021) bilanzieren die Evidenz zu Gruppenbehandlungen für jugendlichen Substanzkonsum. Ihre Diagnose: Die Sorge vor deviancy training (gegenseitigem Lernen abweichenden Verhaltens in Gruppen) hat die Forschungs- und Politikgestaltung stark beeinflusst, aber die empirische Evidenz für tatsächliche Gruppenschäden ist methodisch oft unzureichend. Sie schließen, dass Gruppenformate effektiv sein können und kein außergewöhnliches iatrogenes Risiko bergen, wenn sie methodisch sorgfältig geführt werden – mit der Konsequenz, dass künftige Studien Schadensindikatoren ebenso systematisch erheben sollten wie Wirksamkeitsindikatoren.

Subgruppen-Asymmetrien. González-Guarda und Kollegen (2015) berichten für eine Programmadaption gegen Beziehungsgewalt unter hispanischen Jugendlichen mittlere bis starke positive Effekte für junge Männer, aber „potential iatrogenic effects for reported physical and sexual victimization" bei jungen Frauen (12-Monats-Follow-up höhere Raten als in der Kontrollbedingung). Solche genderasymmetrischen Befunde finden sich auch in der CTC-Forschung (Oesterle et al., 2015) und in der DARE-Folgeforschung. Die Implikation: Gruppen-übergreifende Wirkungsaussagen sind regelmäßig irreführend, wenn keine Subgruppen-Auswertung erfolgt.

Mobbing-Programme. Healy (2020) formuliert drei theoretisch begründete Hypothesen, warum Programme zur Mobbingprävention den Opfern paradoxerweise schaden können – etwa durch verstärkte Stigmatisierung als „Opferrolle" oder durch falsche Anreize für die Mobilisierung von Umstehenden. Die empirische Evidenz ist heterogen, die Hypothesen verdienen aber methodische Berücksichtigung.

Universelle Prävention im deutschsprachigen Raum

Eine besonders sorgfältige Studie zu iatrogenen Effekten kommt aus Würzburg: Buerger und Kollegen (2022) beschreiben in ihrem Studienprotokoll zu DUDE (Universalprävention nicht-suizidalen selbstverletzenden Verhaltens) ein methodisches Design, das iatrogene Effekte explizit prüft: „we have consciously chosen not to employ any psychoeducational elements, as these have triggered iatrogenic effects in other universal prevention programs" (Buerger et al., 2022). Die Vorabprüfung in der Machbarkeitsstudie schloss harmlose Effekte aus, aber erst die laufende Cluster-RCT (n = 3.200, 16 Schulen) wird belastbare Wirksamkeits- und Schadensdaten liefern.

Konsequenzen für die Praxis

Die Lehre aus dieser Befundklasse ist nicht, dass Prävention gefährlich sei. Die Lehre ist methodologisch: Programme verdienen präregistrierte Wirksamkeits- und Schadensindikatoren, Subgruppen-Auswertungen nach Geschlecht und Vulnerabilitätsprofil sowie langfristige Follow-ups, die mindestens drei Jahre nach Programmende reichen. Wer in der GLP-gelisteten Programme implementiert, hat einen Teil dieser Sicherung bereits eingekauft. Wer eigene Programme entwickelt, schuldet seinen Zielgruppen die gleiche Sorgfalt.

Säule 6 – Positive Psychologie und ihre Lücken

Toumbourou bezieht sich für seinen Index menschlicher Freiheit unter anderem auf das PERMA-Modell von Kern, Waters, Adler und White (2015) sowie auf das Flow-Konzept von Csikszentmihalyi (1990). Beide Konzepte stammen aus der positiven Psychologie und sind populärwissenschaftlich erfolgreich. Die empirische Lage ist heterogener, als es die Sekundärliteratur suggeriert.

PERMA und seine Varianten

Das PERMA-Modell (Positive Emotion, Engagement, Relationships, Meaning, Accomplishment) wurde von Seligman entwickelt und von Kern und Kollegen (2015) in einer Schul-Adaption für die Wohlbefindensmessung operationalisiert. Es ist ein heuristisches Rahmenmodell, kein präzise getestetes Strukturgleichungsmodell. Konvergenzvalidität mit anderen Wohlbefindensskalen (z. B. Diener et al.) ist hoch, aber die diskriminative Validität der fünf Dimensionen ist umstritten.

Positive Youth Development (PYD)

Das umfassendere Forschungsfeld ist die Positive Youth Development. Das in der internationalen Literatur einflussreichste Modell ist Lerners „Five Cs" (Competence, Confidence, Connection, Character, Caring). In einer Auswertung norwegischer Schülerinnen und Schüler zeigt ein Beitrag im von Delgado, Huang und Wiium (2021) herausgegebenen Sammelband zum Developmental-Assets-Rahmen einen differenzierenden Befund: „regression analysis showed that only two of four internal assets […] and two of four external assets […] remained significantly associated with thriving" (in Delgado, Huang & Wiium, 2021). Eine Schwesterauswertung im selben Sammelband – Uka, Musliu und Kollegen (2021) zu Kosovo-Jugendlichen mit dem 5C-Rahmen – stellt zudem fest: „competence, confidence and connection are related to both life satisfaction and well-being, but this is not true for character and caring" (Uka et al., 2021, in Delgado, Huang & Wiium, 2021).

Diese Differenzierung ist konzeptionell brisant: Wenn Character und Caring – also die ethisch-prosozialen Komponenten – nicht den gleichen empirischen Bezug zu Wohlbefinden haben wie die individualpsychologisch näher liegenden Komponenten, dann ist die Brücke zwischen Toumbourous prosozialer Motivation und positiver Wohlbefindensförderung weniger selbstverständlich, als das pauschale „PYD funktioniert" suggerieren würde. Solche Asymmetrien zwischen Wohlbefindens- und Prosozialitätsmaßen sind in der Forschung dokumentiert, aber selten kommuniziert.

Larsons Selbstkritik

Eine der nüchternsten Selbsteinschätzungen kommt aus dem PYD-Feld selbst. Larson (zitiert in Reprint 2020) formuliert: „we have numerous research-based programs for youth aimed at curbing drug use, violence, suicide, teen pregnancy, and other problem behaviors, but lack a rigorous applied psychology of how to promote positive youth development" (Larson, 2020). Das ist ein bemerkenswertes Eingeständnis: Die Defizit- und Risiko-Forschung hat in der Präventionswissenschaft eine längere und methodisch belastbarere Tradition als die Förderung positiver Entwicklung.

Implikation

Toumbourous Index menschlicher Freiheit bezieht aus PERMA und Flow eine theoretische Plausibilität, die bei methodisch näherer Betrachtung weniger fest ist als die Risiko-Schutzfaktor-Komponenten seines Modells. Das ist keine Widerlegung – PERMA ist ein nützliches Heuristikmodell –, aber es ist eine Mahnung, die Belastbarkeitsklassen nicht zu vermischen.

Säule 7 – Freiheit, Wohlfahrt, Menschenrechte

Die ökonomisch-politische Schicht in Toumbourous Modell ist konzeptionell die heterogenste. Er stützt sich auf:

  • Friedman und Friedman (1990): liberale Ökonomie mit Fokus auf individuelle Marktfreiheit.
  • Sachs (2005): entwicklungstheoretisches Plädoyer für Armutsbekämpfung durch Investitionen.
  • Murray und Lopez (2013): Global-Burden-of-Disease-Forschung.
  • Freedom House (2015): US-amerikanische NGO mit Menschenrechtsindex, der politische Kontroversen ausgelöst hat.

Diese Quellen vertreten unterschiedliche, teils widersprüchliche Freiheitsbegriffe. Friedmans negative Freiheit (Freiheit von staatlichem Zwang) steht im Spannungsverhältnis zu Sachs' positiver Freiheit (Verwirklichungschance durch staatliche Investitionen). Murray und Lopez liefern einen technisch-medizinischen Indikator, der mit beiden Konzeptionen kompatibel ist, aber keine Aussage zur normativen Begründung liefert. Freedom House ist methodologisch in den Politikwissenschaften umstritten – die Operationalisierung von „Demokratie" wird teils als US-zentriert kritisiert.

Toumbourou selbst markiert diese Heterogenität nicht. Er bezieht aus jeder Quelle, was seinem Index zuträglich ist. Das ist ein eklektisches, kein integriertes Vorgehen. Für eine deutschsprachige Rezeption empfiehlt sich, diese Heterogenität explizit zu benennen: Wer Toumbourous Konzept in eine Theorie der Sozialpolitik überführen will, muss zuerst klären, welcher Freiheitsbegriff trägt.

Eine schlankere Alternative wäre die Anbindung an Amartya Sens und Martha Nussbaums Capability Approach, der prosoziales Handeln, Wirkungswissen und Freiheit kohärenter integriert – aber Toumbourou wählt diese Anbindung nicht. Das ist eine offene Stelle des Modells.

Säule 8 – Fachkräftebasis, EUPC und Professionalisierung

Eine der wichtigsten Erweiterungen, die Toumbourous theoretischer Rahmen für die deutschsprachige Praxis benötigt, ist die Frage: Wer übt evidenzbasiertes prosoziales Handeln eigentlich aus? Lehrkräfte? Sozialpädagoginnen? Polizeibeamte? Ärztinnen? Ehrenamtliche? Und welche Qualifikation brauchen sie?

Das European Prevention Curriculum (EUPC)

Das EUPC ist eine Antwort auf diese Lücke. Es wurde im Auftrag des EMCDDA (jetzt EUDA) von einer internationalen Arbeitsgruppe entwickelt und basiert auf den UNODC International Standards on Drug Use Prevention sowie den EMCDDA Quality Standards. Es vermittelt in 30 Stunden die Grundlagen evidenzbasierter Präventionsarbeit – Risiko- und Schutzfaktoren, Wirkungsforschung, Programmauswahl, Implementierung, Evaluation.

Brotherhood und Nobre-Sandoval (2025) eröffnen mit einem Sammelbandbeitrag das Special Issue des Journal of Prevention zu EUPC-Implementationserfahrungen in Europa. Sie bilanzieren, dass die Diffusion in den Mitgliedstaaten heterogen verläuft.

Für den deutschen Kontext ist die Studie von von Heyden, Voit und Bremer (2025) zentral. Sie dokumentiert die Implementationserfahrungen, Hürden und nächsten Schritte des EUPC in Deutschland und identifiziert sowohl strukturelle Förderbedarfe (Anschlussfähigkeit an die kommunale Suchtprävention, Anerkennung als Fortbildung) als auch inhaltliche Anpassungsnotwendigkeiten (deutsche Fallbeispiele, Bezug zur GLP).

Akzeptanz unter Fachkräften

Henriques und Burkhart (2020) berichten aus Portugal eine ernüchternde Beobachtung, die für Deutschland ähnlich gelten dürfte: „Enrolment has been difficult, probably for three reasons: i) people tend to believe that they know everything about prevention, ii) the prevention of substance use might be too narrow a field, and iii) there is no perceived need for a specific qualification in order to do prevention work in Portugal" (Henriques & Burkhart, 2020). Die Professionalisierung der Fachkräfte scheitert weniger an Inhalten als an einer wahrgenommenen Bedarfsdiagnose. Wer glaubt, Prävention sei intuitiv lernbar, wird sich nicht weiterbilden.

Die Implikation für Toumbourous Modell ist klar: Wirkungswissen entsteht nicht in den Köpfen einzelner; es entsteht in einer Berufspraxis, die strukturiert weitergegeben wird. Professionalisierung ist die institutionelle Bedingung evidenzbasierten prosozialen Handelns.

Anschlussfähigkeit an die Grüne Liste

Brender und Kollegen (2024) sowie Bremer und Kollegen (2024) skizzieren die Verzahnung zwischen GLP, EUPC und kommunaler Praxis. Die Grüne Liste ist die Programm-Datenbank, das EUPC ist die Methoden-Schule, CTC ist der kommunale Implementationsrahmen. In diesem Dreigestirn liegt die Operationalisierung von Toumbourous Theorem im DACH-Raum – mehr brauchen Kommunen, Träger und Politik nicht, um den Anspruch evidenzbasierten prosozialen Handelns ernsthaft einzulösen.

Vergleichstabelle der acht Säulen

Säule Wirknachweis Effektgröße Subgruppen-Heterogenität Nachhaltigkeit DACH-Übertragbarkeit Kostenprofil
1 – Wirkungswissen / Register konzeptionell etabliert hoch (institutionell) hoch (GLP existiert) gering
2 – SDM/SSDP nichtrandomisiert RCT-nah klein bis mittel gering bei Schutzfaktoren hoch bei psychischer Gesundheit, niedrig bei Substanzkonsum mittel hoch (Schulsystem)
3 – CTC RCT (CYDS) + Replikation klein (12 – 32 % Inzidenzreduktion) hoch (Männer > Frauen) mittel; verfliegt nach 19 J. offen (Studie läuft) mittel; BCR 5 – 8
4 – Intergruppenkontakt Meta-Analyse klein (r ≈ −.21) hoch (kulturmoderiert) niedrig (6-Monats-Verfall) mittel gering bis mittel
5 – Iatrogene Effekte meta-analytisch dokumentiert je nach Programm hoch (geschlecht- und vulnerabilitätsspezifisch) hoch (Lehre)
6 – Positive Psychologie / PYD heterogen klein bis mittel hoch (5C-Asymmetrie) mittel mittel gering
7 – Freiheit / ökon.-pol. Anker konzeptionell gering (US-zentriert)
8 – Fachkräftebasis / EUPC Implementations-Evidenz hoch wenn institutionell verankert hoch (Deutschland aktiv) gering bis mittel

Die Tabelle zeigt: Die Wirknachweise sind in den Säulen 2, 3 und 4 am robustesten. Die DACH-Übertragbarkeit ist in den Säulen 1, 5 und 8 am höchsten. Die Nachhaltigkeit ist überall ein offenes Thema. Wer in der Praxis prosoziales Handeln evidenzbasiert ausrichten will, sollte diese Asymmetrie kennen.

Übertragbarkeit: DACH-Spezifika, Migration, Kosten

DACH-Spezifika

Drei Strukturmerkmale unterscheiden die deutschsprachige Präventionslandschaft von der US-amerikanischen, in der die meisten Originalstudien entstanden:

Föderalismus. Deutschland und die Schweiz haben subsidiäre Bildungs-, Gesundheits- und Präventionssysteme. Das erschwert flächendeckende Programmeinführungen, ermöglicht aber lokale Anpassung. Programme der GLP sind regelmäßig in einzelnen Bundesländern verbreitet, aber nicht bundesweit.

Sozialstaatliche Einbettung. Die in WSIPP-Modellrechnungen (Aos et al., 2011; Kuklinski et al., 2015) zentralen monetisierten Folgekosten – insbesondere Strafvollzug, Krankenkostenanteile bei Privatversicherten, Erwerbsausfall – haben in DACH-Sozialstaatsstrukturen andere Größenordnungen. Eine 1:1-Übersetzung von US-Nutzen-Kosten-Verhältnissen in den deutschen Kontext ist methodisch nicht zulässig. Die deutsche CTC-Studie (Röding et al., 2021) wird eigene ökonomische Analysen liefern müssen.

Personalstruktur. US-amerikanische Programme nutzen häufig speziell ausgebildete Präventionsfachkräfte. Im DACH-Raum übernehmen diese Aufgabe oft Lehrkräfte, Sozialarbeiterinnen, Suchtberater oder Polizeibeamte – mit teils sehr unterschiedlicher Vorqualifikation. Das EUPC adressiert diese Lücke (von Heyden, Voit, & Bremer, 2025), seine flächendeckende Verankerung steht aber noch aus.

Migration und kulturelle Moderation

Toumbourous Bezug auf Tajfel und Turner (1986) gewinnt im DACH-Kontext besondere Bedeutung, weil die zugehörigen Forschungsbefunde zur Intergruppenkontakt-Wirksamkeit stark vom kulturellen Kontext moderiert sind (Kende et al., 2017). Für migrationsgeprägte deutsche Stadtgesellschaften (Berlin, Frankfurt, Stuttgart, Wien, Zürich) heißt das: Präventionsangebote, die strukturierten, längerfristigen Kontakt zwischen Mehrheits- und Minderheitsgruppen unter ressourcengleichen Bedingungen ermöglichen, haben empirisch belastbare Erfolgsaussichten – wenn sie nicht als einzelne Veranstaltung, sondern als institutionalisierte Praxis angelegt sind. Punktuelle Begegnungsangebote sind nicht wirkungslos, aber ihre Effekte verfliegen (Pakrashi, 2020).

Eine spezifisch deutsche Forschungslücke: Es liegen wenige RCTs zu Intergruppenkontakt in deutschen Schulen mit migrationsbezogenen Outgroups vor. Beelmann und Heinemanns (2014) Übersicht ist hier ein wichtiger Bezugspunkt, aber sie ist mittlerweile zehn Jahre alt.

Kosten

Eine vorsichtige Faustformel für die deutsche Praxis: Internationale CTC-Kosten-Nutzen-Verhältnisse (5,3 bis 8,2 zu 1) sind als obere Schätzung zu lesen. Realistischer ist ein Verhältnis von 2 bis 4 zu 1 nach Anpassung an deutsche Sozialstaatskostenstrukturen. Das ist immer noch ökonomisch attraktiv – aber es lässt mehr Raum für Implementationsverluste als die US-Originalwerte.

Synthese: Fünf Konvergenzlinien

Wenn man die acht Säulen quer liest, ergeben sich fünf Befunde, die unabhängig von der theoretischen Einordnung gelten:

1. Bindung wirkt. Über alle Säulen hinweg – SDM, CTC, Intergruppenkontakt, PYD – sind soziale Bindungen der konsistenteste Wirkmechanismus. Familienbindung, Schulbindung, Peer-Bindung, Bindung zwischen Gruppen. Wer die Bindungsstrukturen einer Population stärkt, hat höhere Erfolgsaussichten als wer kognitive Botschaften vermittelt.

2. Effekte sind klein. Die meta-analytischen Effektgrößen liegen in der Größenordnung r ≈ 0,2 bis d ≈ 0,3. Das ist deutlich weniger, als die Praxisrhetorik oft suggeriert, aber bei Bevölkerungsanwendung populationsrelevant. Eine Inzidenzreduktion um 12 bis 32 Prozent (Spoth et al., 2013, dokumentiert in Oesterle et al., 2015) bedeutet bei einer Risikopopulation von 100.000 Jugendlichen einen Unterschied im fünfstelligen Bereich.

3. Subgruppen sind nicht gleich. Geschlecht, Vulnerabilitätsprofil und kultureller Kontext moderieren Effekte massiv. Ein Programm, das männlichen Jugendlichen aus mittleren Sozialschichten hilft, kann weiblichen Jugendlichen aus prekarisierten Verhältnissen schaden oder gar nicht erreichen (González-Guarda et al., 2015; Renner et al., 2024).

4. Nachhaltigkeit ist die unterschätzte Größe. Die meisten dokumentierten Effekte verflüchtigen sich, wenn die Förderung endet. Das gilt für Intergruppenkontakt (Pakrashi, 2020) ebenso wie für CTC-Sekundärindikatoren (Oesterle et al., 2015) und PYD-Studien. Strukturelle Verankerung ist die Antwort, nicht Programmwiederholung.

5. Wirkungswissen ist eine Daueraufgabe. Toumbourous Forderung nach Systematisierung von Wirkungswissen ist nicht erfüllt mit der Existenz von Cochrane, WSIPP und der GLP. Sie ist nur erfüllt, wenn diese Institutionen kontinuierlich aktualisiert, kritisch geprüft und in der Praxis genutzt werden. Brender und Kollegen (2024) zeigen, dass die GLP an einigen Stellen Lücken hat (Ernährung, Bewegung). Das ist ein Auftrag, kein Fehler.

Praxis-Box nach Ausgangslage

Für Schulen

  • Programmauswahl ausschließlich aus der GLP oder vergleichbaren validierten Registern.
  • Bei Eigenentwicklungen: Wirksamkeitsnachweis als Voraussetzung, nicht als Nachgedanke. Prä-Post-Erhebungen mit mindestens einer Kontrollgruppe.
  • Subgruppen-Auswertung nach Geschlecht und sozioökonomischem Status als Standard.
  • Begegnungsformate (Schulpartnerschaften, Buddyprogramme) auf mindestens ein Schuljahr anlegen, nicht als Projektwoche.

Für Kommunen

  • CTC oder vergleichbare Bündnis-basierte Systeme mit Bedarfsanalyse, nicht mit Programm-Vorgabe beginnen.
  • Anschluss an die Grüne Liste Prävention für Programmauswahl.
  • Begleitevaluation einplanen, auch wenn es nur deskriptive Verlaufsdaten sind. Ohne Daten keine Steuerung.
  • Realistische Erwartungen kommunizieren: kleine Effekte, lange Zeiträume, Subgruppen-Asymmetrien.

Für Träger und Verbände

  • Qualifizierung der Fachkräfte über das EUPC oder vergleichbare strukturierte Programme.
  • Programm-Portfolio regelmäßig gegen den Stand der GLP abgleichen. Nicht-evidenzbasierte Programme zu reformieren oder zu beenden ist ein legitimer und wichtiger Schritt.
  • In der externen Kommunikation Effekte differenziert darstellen, nicht maximieren. Glaubwürdigkeit ist langfristig wertvoller als kurzfristige Aufmerksamkeit.

Für Politikberatung

  • Kosten-Nutzen-Verhältnisse aus US-Studien nicht 1:1 übernehmen, sondern an DACH-Sozialstaatsstrukturen anpassen.
  • Förderprogramme längerfristig anlegen (mindestens fünf Jahre), um Nachhaltigkeitsprobleme zu adressieren.
  • Forschungsförderung für Replikations- und Adaptionsstudien im DACH-Raum, insbesondere für migrationsbezogene Zielgruppen.
  • Investitionen in Fachkräftestrukturen (EUPC, Anerkennung als Fortbildung, Stellenprofile in Kommunalverwaltungen).

Limitationen

Dieser Beitrag hat selbst Grenzen, die transparent benannt werden sollen.

Beneficial Action Theory empirisch kaum geprüft. Toumbourous Modell ist seit fast einem Jahrzehnt im Raum, aber es liegen keine direkten empirischen Tests des Konstrukts vor. Die im Beitrag angeführten Studien stützen einzelne Bestandteile des Modells (SDM, CTC, Intergruppenkontakt), nicht das Modell als integrative Theorie.

Replikationsschwächen. Mehrere zentrale Befunde (PYD-5C-Modell, PERMA-Faktorstruktur, australische CTC-Auswertungen) sind in unterschiedlichen kulturellen Kontexten nur eingeschränkt repliziert worden. Die in diesem Beitrag genutzten Effektgrößen sind als plausible Schätzungen zu lesen, nicht als gesicherte Punkt-Werte.

Gender- und Vulnerabilitätsasymmetrien. Die Befunde zu Subgruppen-Heterogenität (Oesterle et al., 2015; Renner et al., 2024; González-Guarda et al., 2015) sind beunruhigend, aber sie sind in der internationalen Literatur unterrepräsentiert. Es ist plausibel, dass die hier dokumentierten Asymmetrien nur einen Bruchteil der tatsächlich vorhandenen Heterogenität abbilden.

Westlicher Bias. Die meisten zentralen Studien stammen aus den USA, Australien, Großbritannien und Kontinentaleuropa. Die globale Reichweite, die Toumbourous Modell einfordert, ist in der zugrunde liegenden Evidenz nicht gegeben. Beneficial Action für die globale Bevölkerung ist eine Forderung, deren empirische Grundlage primär einen Bevölkerungsausschnitt umfasst, der etwa 15 Prozent der Weltbevölkerung repräsentiert.

Sprachliche Reduktion. Die deutsche Übersetzung „evidenzbasiertes prosoziales Handeln" verkürzt Toumbourous Beneficial Action um die Konnotation des „nutzenstiftenden Handelns". Im Englischen schwingt eine konsequentialistische Ethik mit, die im Deutschen verloren geht. Wer den Begriff nutzt, sollte diese Übersetzungslücke kennen.

Schluss

Toumbourou hat einen Punkt benannt, der in der Präventionsforschung lange unausgesprochen war: Wer prosozial handeln will, schuldet seinen Adressaten mehr als gute Absichten. Diese Zuspitzung ist sachlich richtig, ethisch tragfähig und politisch anschlussfähig. Sie lässt sich aus der Evidenz von Cochrane, WSIPP, der Grünen Liste, dem SDM, CTC und der Kontakthypothese überzeugend stützen.

Was die Theorie nicht leistet, ist eine empirische Vermessung ihres eigenen Anspruchs. Die Forschungsliteratur seit 2016 hat das Konzept zitiert, aber selten geprüft. Das ist nicht der Theorie vorzuwerfen – sie ist ein Programm, kein Befund –, aber es ist ein Mahnung an die Rezeption: Wer Beneficial Action zur Begründung einer Programmentscheidung nutzt, sollte die spezifischen Wirkbefunde der angeführten Programme kennen, nicht nur die theoretische Begründungsfigur. Sonst wäre der Bezug auf evidenzbasiertes Handeln selbst nicht evidenzbasiert.

Der ethische Anker bleibt: Prosoziales Handeln mit Wirkungswissen, nicht statt Wirkungswissen. Wer einen Effekt von 12 bis 32 Prozent Inzidenzreduktion (Oesterle et al., 2015) ehrlich als das vermittelt, was er ist – ein bedeutsamer, aber kleiner Schritt –, handelt prosozialer als wer Wundereffekte verspricht und damit das Vertrauen der Adressaten in die Präventionspraxis insgesamt beschädigt. Toumbourou wäre einverstanden.

Literaturverzeichnis

Allport, G. W. (1954). The nature of prejudice. Addison-Wesley.

Aos, S., Lee, S., Drake, E., Pennucci, A., Klima, T., Miller, M., Anderson, L., Mayfield, J., & Burley, M. (2011). Return on investment: Evidence-based options to improve statewide outcomes. Washington State Institute for Public Policy.

Beelmann, A., & Heinemann, K. S. (2014). Preventing prejudice and improving intergroup attitudes: A meta-analysis of child and adolescent training programs. Journal of Applied Developmental Psychology, 35(1), 10 – 24. https://doi.org/10.1016/j.appdev.2013.11.002

Bremer, K., Brender, R., & Groeger-Roth, F. (2022). Grüne Liste Prävention – Eine Datenbank evidenzbasierter Präventionsprogramme. https://doi.org/10.1055/s-0042-1753992

Bremer, K., Brender, R., & Groeger-Roth, F. (2024). Grüne Liste Prävention – Ein Beitrag zur Evidenzbasierung. Public Health Forum, 32(4), 386 – 389. https://doi.org/10.1515/pubhef-2024-0111

Brender, R., Bremer, K., Kula, A., Mauz, E., Marx, J., Hoffmann, S., & Groeger-Roth, F. (2024). Evidenzregister Grüne Liste Prävention – Analyse der gelisteten wirksamkeitsgeprüften Programme. Das Gesundheitswesen, 86(7), 474 – 482. https://doi.org/10.1055/a-2308-7256

Brotherhood, A., & Nobre-Sandoval, L. (2025). How is the European Prevention Curriculum (EUPC) implemented in practice and what lessons have we learnt so far? Introduction to the special issue. Journal of Prevention, 46(5), 667 – 675. https://doi.org/10.1007/s10935-025-00877-4

Buerger, A., Emser, T. S., Seidel, A., Scheiner, C., von Schoenfeld, C., Ruhe, J., Pasek, F., Joos-Bouguern, A., & Romanos, M. (2022). DUDE – A universal prevention program for non-suicidal self-injurious behavior in adolescence based on effective emotion regulation: Study protocol of a cluster-randomized controlled trial. Trials, 23(1), 97. https://doi.org/10.1186/s13063-021-05973-4

Catalano, R. F., & Hawkins, J. D. (1996). The social development model: A theory of antisocial behavior. In J. D. Hawkins (Hrsg.), Delinquency and crime: Current theories (S. 149 – 197). Cambridge University Press.

Csikszentmihalyi, M. (1990). Flow: The psychology of optimal experience. Harper & Row.

Delgado, B., Huang, X., & Wiium, N. (2021). Positive youth development in contexts. https://doi.org/10.32320/978-961-270-341-7

Dovidio, J. F., Love, A., Schellhaas, F. M. H., & Hewstone, M. (2017). Reducing intergroup bias through intergroup contact: Twenty years of progress and future directions. Group Processes & Intergroup Relations, 20(5), 606 – 620. https://doi.org/10.1177/1368430217712052

Freedom House. (2015). Freedom in the world 2015. Freedom House.

Friedman, M., & Friedman, R. (1990). Free to choose: A personal statement. Harcourt Brace Jovanovich.

González-Guarda, R. M., Guerra, J. E., Cummings, A. A., Pino, K., & Becerra, M. M. (2015). Examining the preliminary efficacy of a dating violence prevention program for Hispanic adolescents. The Journal of School Nursing, 31(6), 411 – 421. https://doi.org/10.1177/1059840515598843

Groeger-Roth, F. (2024). CTC: kommunale Gesundheitsförderung bei Kindern und Jugendlichen. Public Health Forum, 32(3), 242 – 244. https://doi.org/10.1515/pubhef-2024-0070

Hawkins, J. D., Catalano, R. F., Kosterman, R., Abbott, R., & Hill, K. G. (1999). Preventing adolescent health-risk behaviors by strengthening protection during childhood. Archives of Pediatrics & Adolescent Medicine, 153(3), 226 – 234. https://doi.org/10.1001/archpedi.153.3.226

Hawkins, J. D., Oesterle, S., Brown, E. C., Arthur, M. W., Abbott, R. D., Fagan, A. A., & Catalano, R. F. (2009). Results of a type 2 translational research trial to prevent adolescent drug use and delinquency: A test of Communities That Care. Archives of Pediatrics & Adolescent Medicine, 163(9), 789 – 798. https://doi.org/10.1001/archpediatrics.2009.141

Hawkins, J. D., Kosterman, R., Catalano, R. F., Hill, K. G., & Abbott, R. D. (2005). Promoting positive adult functioning through social development intervention in childhood: Long-term effects from the Seattle Social Development Project. Archives of Pediatrics & Adolescent Medicine, 159(1), 25 – 31. https://doi.org/10.1001/archpedi.159.1.25

Hawthorne, G. (1996). The social impact of Life Education: Estimating drug use prevalence among Victorian primary school students and the statewide effect of the Life Education programme. Addiction, 91(8), 1151 – 1160. https://doi.org/10.1046/j.1360-0443.1996.91811517.x

Healy, K. L. (2020). Hypotheses for possible iatrogenic impacts of school bullying prevention programs. Child Development Perspectives, 14(4), 221 – 228. https://doi.org/10.1111/cdep.12385

Henriques, S., & Burkhart, G. (2020). The first university e-learning study programme based on the adaption of the EUPC: Portuguese implementation study. Adiktologie. https://doi.org/10.35198/01-2019-001-0004

Hill, K. G., Steeger, C. M., Epstein, M., Bailey, J. A., Hawkins, J. D., Catalano, R. F., & Kosterman, R. (2025). Addressing suicide and mental health through universal childhood intervention: Results from the Seattle Social Development Project. Prevention Science. https://doi.org/10.1007/s11121-025-01834-7

Hogue, A., Henderson, C. E., Ozechowski, T. J., Becker, S. J., & Schwartz, R. P. (2021). Can the group harm the individual? Reviewing potential iatrogenic effects of group treatment for adolescent substance use. Clinical Psychology: Science and Practice, 28(1), 40 – 51. https://doi.org/10.1111/cpsp.12307

Kende, J., Phalet, K., Van Den Noortgate, W., Kara, A., & Fischer, R. (2017). Equality revisited: A cultural meta-analysis of intergroup contact and prejudice. Social Psychological and Personality Science, 9(8), 887 – 895. https://doi.org/10.1177/1948550617728993

Kern, M. L., Waters, L. E., Adler, A., & White, M. A. (2015). A multidimensional approach to measuring well-being in students: Application of the PERMA framework. The Journal of Positive Psychology, 10(3), 262 – 271. https://doi.org/10.1080/17439760.2014.936962

Kim, B.-K. E., Gilman, A. B., Hemphill, S. A., & Hawkins, J. D. (2016). Examining protective factors against violence among high-risk youth: Findings from the Seattle Social Development Project. Journal of Criminal Justice, 45, 19 – 25. https://doi.org/10.1016/j.jcrimjus.2016.02.015

Kim, B.-K. E., Oesterle, S., Hawkins, J. D., & Shapiro, V. B. (2015). Assessing sustained effects of Communities That Care on youth protective factors. Journal of the Society for Social Work and Research, 6(4), 565 – 589. https://doi.org/10.1086/684163

Kuklinski, M. R., Fagan, A. A., Hawkins, J. D., Briney, J. S., & Catalano, R. F. (2015). Benefit-cost analysis of a randomized evaluation of Communities That Care: Monetizing intervention effects on the initiation of delinquency and substance use through grade 12. Journal of Experimental Criminology, 11(2), 165 – 192. https://doi.org/10.1007/s11292-014-9226-3

Larson, R. W. (2020). Toward a psychology of positive youth development. Journal of Child and Youth Care Work, 24, 149 – 179. https://doi.org/10.5195/jcycw.2012.55

Mejía-Trujillo, J., Pérez-Gómez, A., & Reyes, J. (2015). Implementación y adaptación en Colombia del sistema preventivo Communities That Care. Adicciones, 27(4), 253 – 264. https://doi.org/10.20882/adicciones.750

Murray, C. J. L., & Lopez, A. D. (2013). Measuring the global burden of disease. New England Journal of Medicine, 369(5), 448 – 457. https://doi.org/10.1056/NEJMra1201534

Oesterle, S., Hawkins, J. D., Kuklinski, M. R., Fagan, A. A., Fleming, C., Rhew, I. C., Brown, E. C., Abbott, R. D., & Catalano, R. F. (2015). Effects of Communities That Care on males' and females' drug use and delinquency 9 years after baseline in a community-randomized trial. American Journal of Community Psychology, 56(3 – 4), 217 – 228. https://doi.org/10.1007/s10464-015-9749-4

Pakrashi, D. (2020). Intergroup contact and prejudice: Evidence from Indian slums. AEA RCT Registry. https://doi.org/10.1257/rct.6608

Pereira da Costa, M., Bierwiaczonek, K., & Bianchi, M. (2024). Does digital intergroup contact reduce prejudice? A meta-analysis. Cyberpsychology, Behavior, and Social Networking. https://doi.org/10.1089/cyber.2023.0591

Pettigrew, T. F., & Tropp, L. R. (2006). A meta-analytic test of intergroup contact theory. Journal of Personality and Social Psychology, 90(5), 751 – 783. https://doi.org/10.1037/0022-3514.90.5.751

Renner, H. M., Rowland, B., Hutchinson, D., Toumbourou, J. W., & Heerde, J. A. (2024). The role of adolescent social inclusion in educational attainment among vulnerable youth. Child and Adolescent Mental Health, 29(2), 161 – 169. https://doi.org/10.1111/camh.12709

Ringwalt, C. L., Ennett, S. T., & Holt, K. D. (1991). An outcome evaluation of Project DARE (Drug Abuse Resistance Education). Health Education Research, 6(3), 327 – 337. https://doi.org/10.1093/her/6.3.327

Röding, D., Soellner, R., Reder, M., Birgel, V., Kleiner, C., Stolz, M., Bonell, C., Forberger, S., Walter, U., & Hartung, S. (2021). Study protocol: A non-randomised community trial to evaluate the effectiveness of the Communities That Care prevention system in Germany. BMC Public Health, 21(1), 1927. https://doi.org/10.1186/s12889-021-11935-x

Sachs, J. D. (2005). The end of poverty: Economic possibilities for our time. Penguin Press.

Sackett, D. L., Rosenberg, W. M. C., Gray, J. A. M., Haynes, R. B., & Richardson, W. S. (1996). Evidence based medicine: What it is and what it isn't. BMJ, 312(7023), 71 – 72. https://doi.org/10.1136/bmj.312.7023.71

Salazar, A. M., Haggerty, K. P., Briney, J. S., Cienfuegos, A., Spencer, M., & Lertola, J. (2019). Assessing an adapted approach to Communities That Care for child maltreatment prevention. Journal of the Society for Social Work and Research, 10(3), 349 – 369. https://doi.org/10.1086/704210

Spoth, R., Redmond, C., Shin, C., Greenberg, M., Feinberg, M., & Schainker, L. (2013). PROSPER community–university partnership delivery system effects on substance misuse through 6½ years past baseline from a cluster randomized controlled intervention trial. Preventive Medicine, 56(3 – 4), 190 – 196. https://doi.org/10.1016/j.ypmed.2012.12.013

Steiner, R. J., Sheremenko, G., Lesesne, C. A., Dittus, P. J., Sieving, R. E., & Ethier, K. A. (2019). Adolescent connectedness and adult health outcomes. Pediatrics, 144(1), e20183766. https://doi.org/10.1542/peds.2018-3766

Tajfel, H., & Turner, J. C. (1986). The social identity theory of intergroup behaviour. In S. Worchel & W. G. Austin (Hrsg.), Psychology of intergroup relations (2. Aufl., S. 7 – 24). Nelson-Hall.

Toumbourou, J. W. (2016). Beneficial action within altruistic and prosocial behavior. Review of General Psychology, 20(3), 245 – 258. https://doi.org/10.1037/gpr0000081

Toumbourou, J. W., Rowland, B., Williams, J., Smith, R., & Patton, G. C. (2019). Community intervention to prevent adolescent health behavior problems: Evaluation of Communities That Care in Australia. Health Psychology, 38(6), 536 – 544. https://doi.org/10.1037/hea0000735

Trujillo, Á., & Cardona-Isaza, A. J. (2025). Factorial structure analysis of the CTC Youth Survey in Colombian adolescents. Journal of Prevention, 46(4), 565 – 582. https://doi.org/10.1007/s10935-025-00855-w

Uka, F., Musliu, A., Mehmeti, F., Bajgora, A., & Isufi, A. (2021). The effects of 5Cs and developmental assets on well-being and satisfaction with life among youth in Kosovo. In B. Delgado, X. Huang, & N. Wiium (Hrsg.), Positive youth development in contexts (S. 37 – 55). Pedagoški inštitut.

von Heyden, M., Voit, V., & Bremer, K. (2025). Implementing the European Prevention Curriculum (EUPC) in Germany: Experiences, challenges, and future directions. Journal of Prevention, 46(5), 707 – 716. https://doi.org/10.1007/s10935-025-00869-4

Welsh, B. C., Yohros, A., & Zane, S. N. (2020). Understanding iatrogenic effects for evidence-based policy: A review of crime and violence prevention programs. Aggression and Violent Behavior, 55, 101511. https://doi.org/10.1016/j.avb.2020.101511

Kontakt

Kontakt aufnehmen

Drei Wege, mit uns zu sprechen.

+49 (0)30 754 395 751Mo–Fr · 09:00 – 17:00 Uhr