SPSS

Achtung: Diese Seite informiert über ein Seminar aus dem Wintersemester 20/21. Diese Unterlagen verbleiben zu Dokumentationszwecken auf dem Server.

Diese Veranstaltung richtet sich an Studierende des Studiengangs MA SIGB (Modul 4).

Ziele der Lehrveranstaltung:

(1) Wissen, wie man SPSS / pspp Dateien erstellt

(2) die zur Fragestellung einer empirischen Studie passende Transformationsstrategie entwickeln können

(3) die zur Fragestellung einer empirischen Studie passende Auswertungsstrategie in SPSS umzusetzen können.

(4) Ergebnisse interpretieren können

(5) über die Ergebnisse in angemessener Terminologie kurze Beiträge schreiben können

Dieses Seminar funktioniert so:

Das SPSS-Seminar war ursprünglich als Präsenzseminar geplant (Seminarsitzungen dienstags 10-12 und Blockwoche). Ein wichtiger Vorteil von Online-Veranstaltungen ist, dass man sie so konzipieren kann, dass nicht alle zur gleichen Zeit die gleichen Dinge tun müssen. Mit der asynchronen Struktur von Online-Veranstaltungen habe ich bereits im Sommersemester gute Erfahrungen gemacht. Und die Klausurergebnisse z. B. in meiner Diagnostikveranstaltungen sind wirklich deutlich besser ausgefallen als jemals zuvor. Ich habe mich deshalb entschieden, das SPSS-Seminar vorwiegend asynchron anzubieten.

D.h.: Jede/r Studierende kann die Seminarsitzungen bearbeiten, wann immer er will. Ergänzend gibt es eine Zoom-Sprechstunde nach Bedarf und zwar zu den Zeiten, zu denen ursprünglich Präsenzveranstaltungen hätten stattfinden sollen (also dienstags von 10-12). Sie schreiben mir bis spätestens Sonntag der vorangehenden Woche eine E-Mail, in der Sie um eine Einladung zur SPSS-Zoomsprechstunde bitten. Ich plane eine Zoomkonferenz und lade Sie ein.

Klausur

Das Modul Quantitative Forschung wird mit einer Klausur abgeschlossen. Diese Klausur bestreiten voraussichtlich Herrn Zwingmann und ich. Ich möchte in dieser Klausur herausfinden, ob Sie die oben genannten Lehrziele erreicht haben. Das funktioniert z. B. so, dass Ihnen das Design einer Studie und einige Variablen vorgestellt werden und Sie sollen dann eine passende Transformationsstrategie entwickeln. Oder Sie erhalten einen Ergebnisausdruck einer anderen Studie. Und Ihre Aufgabe ist es, das Ergebnis in angemessener Terminologie zu beschreiben.

Ich werde für meinen Teil der Klausur in der vorletzten Sitzung dieses Seminars eine Probeklausur hochladen. Die richtigen Lösungen stelle ich in der letzten Sitzung des Seminars vor.

(01) In der ersten Sitzung des SPSS Seminars finden Sie

  1. Einen podcast zur Einführung in SPSS

und 2. Ein Tutorial, das erklärt, wie man in SPSS bzw. pspp Daten eingibt.

Daten eingeben

(2) In der zweiten Sitzung geht es darum, wie man in SPSS bzw. PSPP aus Variablen mit absoluten Zahlen Variablen mit Prozentwerten macht (Transformieren)

Im Tranformationsmenü Prozentzahlen berechnen lassen

(3) In der dritten Lehreinheit geht es darum, wie man SPSS bzw. PSPP dazu bringt, Werte der deskriptiven Statistik zu berechnen.

Ich schlage vor, dass Sie mit dem podcast zu den statistischen Kennwerten beginnen. Bedeutsame inhaltliche Unterschiede zu den von Prof. Zwingmann vermittelten Inhalten gibt es sicher nicht. Aber es macht m. E. durchaus Sinn, z. B. die Berechnung der Standardabweichung per Hand einmal nachzuvollziehen. Die im angesprochenen Tabellen finden Sie in der Diagnostik-Material-Sammlung dieser Homepage.

Statistische Kennwerte

Um die Berechnungen in SPSS bzw. PSPP nachzuvollziehen benötigen noch einmal die bereits im zweiten Tutorial verwendete Datei NRWAusl20200821.sav inklusive der im Rahmen der zweiten Lehreinheit vorgenommenen Tranformationen. Bitte informieren Sie mich per Mail, wenn Ihnen diese Datei nicht vorliegen sollte. Sie erhalten dann umgehend die aktuelle Version.

Beagle 2010: Die durchschnittliche Förderschüleranzahl (1516,48) ist eher niedrig, wenn man sie mit den allgemeinen Schülerzahlen (M=17193,35) vergleicht. Die Standardabweichung hingegen ist sehr hoch, da die Werte im Durchschnitt um 1051,20 Schüler vom Mittelwert abweichen. 

Kommentar Mand: Ok, was genau ist hier berechnet und was bedeutet das nun? Kann das sein, dass wir hier nur den Unterschied zwischen großen und kleinen Städten sehen?

Ylvi  schreibt: Im Anhang erhalten Sie die Analyse der Variable Förderschüler in Prozent. Wie Beagle 2010 erscheint mir die Anzahl der Förderschüler nicht besonders hoch im Gegensatz zur Standardabweichung. Leider gelingt mir noch keine Interpretation der Daten. Die Größe der Städte halte ich allerdings für nicht entscheidend, da es ja um einen prozentualen Anteil geht. Ich sehe da trotz intensiven Nachdenkens keine Korrelation, die ich alleine dieser Statistik entnehmen könnte.  


Studierende 1520: Ich schließe mich, bezogen auf die Aufgabe, meinen beiden Vorrednerinnen an. Es geht mir weiter so wie Ylvi, dass es mir schwerfällt, die Daten zu interpretieren.

Wenn ich zu meinen Überlegungen noch das Minimum und das Maximum dazu nehme, komme ich zu der Idee, dass die Werte ziemlich weit weg liegen vom arithmetischen Mittel. Dadurch entsteht eine große Spannweite. Dadurch kann es vielleicht sein, dass die Standardabweichung durch große und kleine Städte beeinflusst ist. Ich bin mir aber nicht sicher, ob ich das wirklich so interpretieren kann.

Mand: Ich denke, einigen Studierenden fehlt vielleicht noch etwas Übung. Das ist ja bislang nicht alltäglich gewesen, dass Sie sich mit Befunden aus der quantitativen Forschung befassen. Und Sie sehen das richtig: Erstens sind das Prozentwerte und zweitens: Die Standardabweichung ist ziemlich hoch. D.h. es gibt einige Städte mit sehr vielen Förderschülern und andere mit eher wenigen. Das ist schon einmal ein ziemlich interessanter Befund.

(4) In der vierten Lerneinheit geht es ein erstes Mal um Korrelationen. Korrelationen sind das Mittel der Wahl, wenn es darum geht, sich einen ersten Überblick über Zusammenhänge zwischen Variablen zu verschaffen. Korrelationskoeefizienten können, müssen aber keineswegs auf kausale Zusammenhänge verweisen. Es ist also wichtig, hier mit Umsicht vorzugehen.

Es ist sinnvoll, sich zunächst die podcasts zur Standardabweichung und zur Korrelation anzuhören und erst dann in das Tutorial einzusteigen.

Standardabweichung

Korrelationen

Korrelationen – Teil 01

Studierende 152020 schreibt:

Das letzte Tutorial beschäftigte sich mit der Berechnung der Korrelation. Zur Berechnung und Eintrag der Daten, nahmen wir uns die letzte bearbeitete Datei vor. Die Fragestellung, die uns beschäftigt, war: Gibt es einen Zusammenhang zwischen der Anzahl der ausländischen Schüler und den Förderschülerzahlen.

Dafür öffnen wir die Datei und klicken auf Analysieren  Bivariate Korrelation. Danach öffnet sich ein neues Fenster. In diesem klicken wir die Variable „Auslproz“ an und danach das Dreieck. Da wir den Zusammenhang zu den Förderschülern erhalten wollen, klicken wir danach auf „Foerderproz“ und wieder auf das Dreieck. Danach fehlt nur noch der Klick auf das „OK“. Es macht sich ein neues Fenster auf mit der Berechnung des Korrelationskoeffizient, der Signifikanz.

Zur Interpretation unserer Daten:

Da es sich bei dieser Stichprobe, um eine Totalerhebung handelt, braucht die Signifikanz nicht interpretiert werden. Es wurden die Daten über alle Schüler_innen der kreisfreien Städte erhoben und somit braucht man nicht von einem Irrtum in der Berechnung ausgehen. Diese wäre nur sinnig, wenn die Daten einer Stichprobe auf die Grundgesamtheit übertragen werden sollen. Für unsere Daten ergibt sich ein Korrelationskoeffizient von .36. Damit gibt es einen positiven Zusammenhang. In Worte ausgedrückt: Je höher die Zahl der ausländischen Schüler_innen, desto höher ist die Förderschüleranzahl. Weiter handelt es sich um eine moderaten Zusammenhang, da der Wert über 1 und unter 5 liegt.

Mand: Ja, richtig. Allerdings haben Sie sich – glaube ich verschrieben. Es liegt eine moderate Korrelation vor, weil der Wert über 0,3 und unter 0,5 liegt.


Studierende 152020: Ich habe mich tatsächlich verschrieben.

Beagle210: Zusammenfassung vierte Lerneinheit 

Die vierte Lerneinheit befasst sich mit dem Thema der Korrelation, einem Zusammenhangsmaß. Um mit SPSS/PSPP die Korrelation berechnen zu können, nutzen wir die zuletzt bearbeitete Datei. Dabei gilt es herauszufinden, ob die Anzahl der ausländischen Schüler*innen mit den Förderschülerzahlen korrelieren, sprich ob es einen Zusammenhang gibt.

Dafür öffnen wir unsere Datei und klicken oben auf „Analysieren“, klicken weiter auf „Bivariate Korrelation…“ und es öffnet sich ein neues Fenster. In diesem Fenster sehen wir auf der linken Seite unsere Variablen und auf der rechten Seite ein zunächst leeres Feld. Wir wählen nun die Variablen aus, bei denen wir einen Zusammenhang berechnen wollen. Wir klicken also auf Auslproz, dann auf den kleinen Pfeil in der Mitte und Auslproz wandert auf die rechte Seite. Da wir den Zusammenhang zwischen Auslproz und Foerderproz berechnen möchten, klicken wir nun auf die Variable Foerderproz sowie erneut auf den Pfeil in die Mitte und auch Foerderproz wandert auf die rechte Seite. Anschließend klicken wir auf „OK“ und die Korrelation wird berechnet.

Nun öffnet sich ein neues Fenster mit dem errechneten Korrelationskoeffizienten und Signifikanz (Irrtumswahrscheinlichkeit). Wir halten zunächst fest, dass die Signifikanz in unserem Fall unwichtig ist, da eine Totalerhebung und keine Zufallsstichprobe vorliegt. Konzentrieren wir uns nun auf den Korrelationskoeffizienten r= 0.39. Da kein Vorzeichen vorhanden ist, handelt es sich um einen positiven Zusammenhang. Das heißt: Je mehr ausländische Schüler*innen in den kreisfreien Städten NRW, desto mehr Förderschüler*innen gibt es in diesen kreisfreien Städten. Da der Korrelationskoeffizient bei 0.39 liegt und somit über 0.1 und unter 0.5 liegt, handelt es sich um eine moderate Korrelation.

Kommentar Mand (an alle): Kann man Ihrer Ansicht nach aus der gefundenen moderaten Korrelation zwischen Ausländeranteilen und Förderschulquoten irgendetwas ableiten über die Schülerschaft von Förderschulen in kreisfreien Städten NRWs?

EgalwasdukochstKarlMarx: Bei den Berechnung habe ich bin ich zu demselben Ergebnis gekommen, wie meine Kommilitonin Ylvi (Mittelwert 09,07%;Standardabweichung 2,51%).  Ich hätte jetzt aber auch nicht sagen können, ob das jetzt eine hohe oder eine niedrige Standardabweichung ist. Da ich nun durch Ihren Kommentar auf der Website weiß, dass es sich um eine hohe Abweichung handelt, gehe ich mal davon aus, dass Schüler mit Lernproblemen/Förderschulbedarf/Defiziten in manchen Städten eine höhere Chance haben, auf eine Förderschule zu kommen und in anderen eine geringere. So etwas ist auch im Hinblick auf unseren Studiengang natürlich interessant, weil die Frage naheliegt, ob hier eine ungleiche Verteilung von Bildung vorliegt.

Seaside: Aus der moderaten Korrelation ist abzuleiten, dass in kreisfreien Städten NRWs vermehrt ausländische Schüler*innen auf Förderschulen gehen.

(5) Das Thema Korrelation steht auch in der fünften Lerneinheit auf dem Programm.

Sie lernen hier u.a. die Studie kennen, die die Zahlen zum sonderpädagogischen Förderbedarf und kommunale Daten aufeinander bezieht. Veröffentlicht ist diese Studie in der Zeitschrift für Heilpädagogik 2006. Da sind ein paar mehr Daten im Spiel als bisher, obwohl es sich hier noch immer um eine gekürzte Fassung der Originaldatei handelt.

Korrelationen

Seaside Aufgabe: Was korreliert miteinander? Finde heraus, ob es interessante Korrelationen gibt. Interpretiere die Ergebnisse angemessen.

Die einrahmten Aufführungen über Korrelationen finde ich besonders interessant. Bei den anderen Korrelationen bin ich mir z.T. nicht sicher, ob Zusammenhangsaussagen aufgrund der hohen Irrtumswahrscheinlichkeit überhaupt sinnvoll sind.

Frage Seaside: Die Berechnung des Korrelationskoeffizienten ist nicht nur bei Prozentzahlen möglich, richtig?

Antwort Mand: Rechnerisch kann man alle möglichen Werte korrelieren. Das macht aber manchmal keinen Sinn. Wenn man z. B. die Zahl aller Förderschüler pro Stadt verwendet und keine Prozentwerte, dann lassen sich die Ergebnisse nicht mehr vernünftig interpretieren.


Frage Seaside: Ist die Einflussnahme der Signifikanz bei diesen Analysen interessant? Müsste das nicht auch eine Totalerhebung sein und deshalb spielt die Signifikanz keine Rolle? Sind Zusammenhangsaussagen aufgrund einer z.T. hohen prozentualen Signifikanz überhaupt möglich bzw. sinnvoll?

Antwort Mand: Wenn man Lehrbuchwissen zugrunde legt, ist die Berechnung von Irrtumswahrscheinlichkeit bei Totalerhebungen nicht notwendig und auch nicht sinnvoll. Die meisten meiner Kolleg/innen würden die aber in ihren Veröffentlichungen erwähnen, und für alle mir bekannten Zeitschriften wäre dies ein guter Grund, den Beitrag zu drucken.

Ergebnisbericht Seaside:

  1. Korrelation zwischen Arbeitslose in Prozent und Wahlergebnis in Prozent
  • arblosproz und CDU: Korrelation= -0,23; Signifikanz=29%
     schwache negative Korrelation: Je mehr Arbeitslose in einer Stadt, desto weniger wird die CDU gewählt
  • arblosproz und SPD: Korrelation= 0,46; Signifikanz=2,9%
     moderate positive Korrelation und signifikanter Zusammenhang: Je mehr Arbeitslose in einer Stadt, desto mehr wird die SPD gewählt
  • arblosproz und Grüne: Korrelation= -0,07; Signifikanz=75%
     eher keine Korrelation
  • arblosproz und FDP: Korrelation= -0,37; Signifikanz=8,2%
     moderate negative Korrelation: Je mehr Arbeitslose in einer Stadt, desto weniger wird die FDP gewählt.  
  • arblosproz und Linke: Korrelation= -0,41; Signifikanz=23%
     moderate negative Korrelation: Je mehr Arbeitslose in einer Stadt, desto weniger wird die Linke gewählt.
  • arblosproz und Andere: Korrelation= 0,28; Signifikanz=20%
     schwache positive Korrelation: Je mehr Arbeitslose in einer Stadt, desto mehr werden andere Parteien gewählt.

2. Korrelation zwischen Ausländer pro Stadt in Prozent und Arbeitslose in Prozent

Korrelation=0,64; Signifikanz=0,1%
 starke positive Korrelation und hoher signifikanter Zusammenhang: Je mehr Ausländer in einer Stadt, desto höher die Arbeitslosenquote.

Meiner Meinung nach stellt dies ein wirklich wichtiges Ergebnis bei der Auswertung dar!

Korrelation zwischen Ausländer pro Stadt in Prozent und Wahlergebnis

  • auslaenderproz und CDU: Korrelation=-0,4; Signifikanz=87,3%
     moderate negative Korrelation: Je mehr Ausländer in einer Stadt, desto weniger wird die CDU gewählt.
  • auslaenderproz und SPD: Korrelation=0,13; Signifikanz=54,2%
     schwache positive Korrelation: Je mehr Ausländer in einer Stadt, desto mehr wird die SPD gewählt.
  • auslaenderproz und Grüne: Korrelation=0,22; Signifikanz=30,6%
     schwache positive Korrelation: Je mehr Ausländer in einer Stadt, desto mehr werden die Grünen gewählt.
  • auslaenderproz und FDP: Korrelation=0,04; Signifikanz=87%
     eher keine Korrelation
  • auslaenderproz und Linke: Korrelation=-0,49; Signifikanz=15,2%
     moderate/starke negative Korrelation: Je mehr Ausländer in einer Stadt, desto weniger werden die Linken gewählt.
  • auslaenderproz und Andere: Korrelation=-0,05; Signifikanz=81,8%
     eher keine Korrelation
Korrelation Bruttoeinkommen und Wohnmiete pro qm
Bruttoeinkommen und bis 1948: Korrelation=0,47; Signifikanz=3,1%
 moderate positive Korrelation und signifikanter Zusammenhang
Bruttoeinkommen und ab 1949: Korrelation=0,65; Signifikanz=0,2%
 starke positive Korrelation und hoher signifikanter Zusammenhang
Bruttoeinkommen und Neubau: Korrelation=0,75; Signifikanz=0%
 starke positive Korrelation und hoher signifikanter Zusammenhang

Zusammenhangsaussagen können wie folgt für alle Immobilien zusammengefasst werden: Je höher das Bruttoeinkommen der Bürger*innen, desto höher die Miete pro qm innerhalb der Stadt. Dabei ist es egal, ob das Gebäude bis 1948 oder nach 1949 erbaut wurde oder ein Neubau ist. Dies ist dahingehend zu interpretieren, sich der Mietspiegel in Bezug zu dem durchschnittlichen Bruttoeinkommen der Bürger*innen anpasst.

Korrelation von Arbeitslosenproz und Wohnmiete pro qm

arblosproz und bis 1948: Korrelation=-0,41; Signifikanz=6,4%
 moderate negative Korrelation

arblosproz und ab 1949: Korrelation=-0,32; Signifikanz=15,8%
moderate negative Korrelation

arblosproz und Neubau: Korrelation=-0,2; Signifikanz=37,4%
 schwache negative Korrelation

Zusammengefasste Zusammenhangsaussage: Je höher die Arbeitslosenquote einer Stadt, desto niedriger die Wohnmiete pro qm. Dies ist unabhängig vom Erbauungszeitpunkt der Immobilie. Es besteht dabei zumindest bei Immobilien ab 1949 und Neubauten eine sehr hohe Irrtumswahrscheinlichkeit.

Anmerkung Mand:

Es ist durchaus sinnvoll, was Sie da berechnet haben. Dass Wahlergebnisse auch eine ökonomische Basis haben, dürfte z. B. Anhänger marxistischer Positionen erfreuen. Und das in armen Städten (Städten mit vielen Arbeitslosen) die Mieten niedrig sind, bestätigt marktwirtschaftliche Positionen. Das ist aber sicher nicht alles, was der Studie zu entnehmen ist. Es ist z. B. auch sinnvoll, die Auswirkungen von Armutsvariablen auf sonderpädagogische Förderung durchzurechnen.

Ich bin mir nicht sicher, was Sie mit hoher Irrtumswahrscheinlichkeit meinen bzw. wie Sie die Befunde in den Ergebnisbericht übertragen. Normalerweise kennzeichnet man entweder lediglich die signifikanten (z. B. mit p < .05 *) bzw. hoch signifikanten Befunde (z. B. mit p < .01 **) oder nennt die gefundenen p-Werte (z. B. wenn man dem APA-Standard folgt: p =.064). Übersteigt die Irrtumswahrscheinlichkeit 5 % (also p >= .05) , würde man die Nullhypothese verwerfen müssen. Die Zusammenhänge sind dann also nicht signifikant.

Studierende 152020: Korrelationen

  • Aus der PSPP Datei ist zu entnehmen, dass sich mehr Förderschüler_innen in dem Bereich Lernen befinden (dies gilt für alle aufgeführten Städte).
  • Es gibt keinen Zusammenhang zwischen den Lohn- und Einkommenssteuerpflichtigen und dem Förderbereich Lernen zu geben. Jedoch eine positive moderate Korrelation (r = 0.34) in dem Förderbereich emotional/sozial. 
  • Im Bezug auf die Arbeitslosenprozentzahlen sieht dies wiederum anders aus. Im Bereich Lernen zeigt sich eine positive moderate, fast starke Korrelation (r = 0.44). Dagegen nur eine schwache positive Korrelation (r = 0.15) in dem Bereich emotional/sozial.
  • Daraus könnte geschlossen werden, dass sich die Kinder von Einkommensteuerpflichtigen eher in dem Bereich emotional/sozial und die Kinder von Arbeitslosen eher in dem Bereich Lernen. Somit sind die Kinder in diesem Bereich (SE) auch eher von Armut betroffen.
  • Einen starken positiven Zusammenhang (r = 0.51) liegt zwischen den Variablen Ausländerproz. und dem Förderbereich emotional/sozial vor. Daraus lässt sich schließen, dass es mehr Kinder in dem Bereich SE gibt mit einem Migrationshintergrund.
  • Schaut man sich dazu die Korrelation zwischen den Variablen Ausländerproz. und Arbeitslosenproz. an, gibt es hier einen starken positiven Zusammenhang (r = 0.64).
  • Daraus lässt sich schließen, dass Menschen mit einem Migrationshintergrund häufiger von Arbeitslosigkeit/Armut betroffen sind. Jedoch die Kinder in Kombination mit dem Migrationshintergrund sich eher im Bereich emotional/sozial befinden. Anders ist dies anscheinend bei den Menschen ohne einen Migrationshintergrund, da ja hier der moderate Zusammenhang eher in dem Bereich Lernen befindet.
  • Lässt man die Variable Ausländerproz. mit der Variable Arbeitslproz. und Einkommensproz. jeweils miteinander korrelieren, ergibt sich, dass es bei beiden Variablen eine starke positive Korrelation zwischen Einkommenproz. (r = 0.54), aber eine noch stärkere Korrelation (r = 0.64) bei der Variablen arbeitslos gibt. So kann man daraus schließen, dass Menschen mit einem Migrationshintergrund zur einkommenspflichtigen Gesellschaft gehören, dass jedoch die Wahrscheinlichkeit höher liegt, dass sie arbeitslos sind.
  • Im Bezug auf die Kommunalwahlen zeigt sich bei Einkommenspflichtigen ein fast starker negativer Zusammenhang (r = -0.48) in Bezug auf die Wahl der Linken. Daraus lässt sich ableiten, je mehr Einkommenspflichtige es gibt, desto weniger wird die Linke gewählt. Für alle anderen Parteien gibt es nur leichte Zusammenhänge. Der höchste leichte Zusammenhang mit r = 0.24 gibt es bei der Wahl der Grünen. So kann man vielleicht davon ausgehen, dass es dort einen fast moderaten Zusammenhang gibt.
  • Bei den Arbeitslosen sieht es folgendermaßen aus: Je mehr Menschen von Arbeitslosigkeit betroffen sind, desto weniger wird die Linke (r = -0.41), die FDP (r = -0.37) und die CDU (r = -0.23) gewählt. Eine moderate positive Korrelation ergibt sich bei dem Wahlergebnis der SPD (r = 0.46) und bei den anderen Parteien einen leichten moderaten Zusammenhang von r = 0.28. Daher kann man vielleicht sagen, dass je höher die Arbeitslosenquote in einer Stadt ist, die Wahlergebnisse für die SPD am höchsten ausfallen und für die Linke am niedrigsten.
  • Menschen mit einem Migrationshintergrund werden vmtl. die Linke am wenigsten wählen, da es hier einen fast starken negativen Zusammenhang (r = -0.49) gibt. Einen leichten positiven Zusammenhang (r = 0.22) ergibt sich bei der Wahl der Grünen. Daraus folgt ein leichter positiver Zusammenhang (r = 0.13) bei der Wahl der SPD. Alle anderen Parteien erreichen noch nicht einmal einen leichten Zusammenhang.
  • Im Bezug auf die Mieten ab dem Jahr 1949 konnte folgendes festgestellt werden:
    • In Städten mit einer hohen Arbeitslosigkeit werden die Mieten eher gering sein, da es eine Korrelation von r = -0.32 gibt. In Städten mit vermehrt Einkommensteuerpflichtigen gibt es höhere Mieten, da hier die Korrelation bei r = 0.43 liegt. In Städten mit Schülern in dem Bereich Lernen liegen die Mieten ebenfalls sehr niedrig (r = -0.45). Bei dem Bereich SE sieht es anders aus, hier liegt die Korrelation bei r = 0.43. Dadurch kann interpretiert werden, dass die Mieten hier höher sind. Schaut man sich die vorherigen Ergebnisse an, liegt es vmtl daran, dass die meisten Schüler_innen aus dem Bereich SE aus Familien mit Einkommenssteuerpflichtigen kommen. Im Bezug auf den Migrationshintergrund und den Mieten ergibt sich eine Korrelation von r = 0.37.

Beagle210: Fünfte Lerneinheit: Korrelation  

Aus der SPSS/PSPP Datei lassen sich folgende Zusammenhänge entnehmen:

  1. Mit der Einwohnerzahl steigt auch die Schülerzahl aller Schulen Klasse 1-10. r = 0,63 bestätigt einen starken Zusammenhang, d. h. Je höher die Einwohnerzahl einer Stadt, desto höher ist auch die Schülerzahl aller Schulen Klasse 1-10.
  2. Wenn eine Stadt viele Einwohner hat, sind auch mehr Arbeitslose zu verzeichnen. r = 0,61 bestätigt einen starken Zusammenhang, d. h. Je mehr Einwohner eine Stadt, desto höher die Anzahl der Arbeitslosen.
  3. Ausländer sind häufiger von Arbeitslosigkeit und Armut betroffen, weil sie in ihrem Land keine Ausbildung abgeschlossen haben, ihr Berufsschluss hierzulande nicht anerkannt wird, sie der Sprache nicht mächtig sind, etc. r = 0,64 bestätigt einen starken Zusammenhang, d. h. Je höher der Ausländeranteil einer Stadt, desto höher die Arbeitslosenquote.
  4. Lohn- und Einkommensteuerpflichtige wählen eher die FDP oder die Grünen, da es sich um Parteien der sog. „Besserverdienenden“ handelt.

CDU: r = 0, 00

SPD: r = 0,09

Die Grünen: r = 0,24

FDP: r = 0,12

Die Linke: r = -0,48

Andere: r=- 0,11

Die Korrelationen zeigen, dass einen schon fast stark negativen Zusammenhang zwischen Lohn- und Einkommensteuerpflichtige und der Linken Partei gibt, d. h. Je mehr Lohn- und Einkommensteuerpflichtige in einer Stadt, desto weniger wird die Linke gewählt. Einen schwachen aber schon fast moderaten Zusammenhang, gibt es zwischen Lohn- und Einkommensteuerpflichtige und den Grünen, d. h. Je mehr Lohn- und Einkommensteuerpflichtige in einer Stadt, desto mehr werden die Grünen gewählt. 
5. Arbeitslose wählen eher die SPD als andere Parteien, da sie ursprünglich als Arbeiterpartei gegründet wurde und somit die Interessen der sozial Schwachen vertritt.

CDU: r = -0,23

SPD: r = 0,46

Die Grünen: r = -0.07

FDP: r = -0,37

Die Linke: r = -0,41

Andere: r = 0,28

Die Korrelationen zeigen, dass es auch hier einen moderaten negativen Zusammenhang bei den Linken gibt, d. h. Je höher die Arbeitslosenquote einer Stadt, desto weniger wird die Linke gewählt. Einen moderaten schon fast starken Zusammenhang, ist bei der SPD zu sehen, d. h. Je höher die Arbeitslosenquote einer Stadt, desto eher wird die SPD gewählt.
6. Im Hinblick auf den Bildungsstand und den finanziellen Mittel vieler Arbeitslose, lässt sich vermuten, dass es einen Zusammenhang zwischen Arbeitslosenquote und Förderschüler Lernen gibt, da sie ihre Kinder nicht ausreichend unterstützen können. r = 0,46 bestätigt einen moderaten schon fast starken Zusammenhang, d. h. Je höher die Arbeitslosenquote einer Stadt, desto höher die Quote der Förderschüler Lernen.
7. Viele Ausländer können ihre Kinder nur bedingt schulisch unterstützen, weil sie selbst keine Schule besucht haben, das Schulsystem anders ist, die Sprache eine Barriere darstellt, usw. r= 0,03 zeigt, dass es schon fast keinen Zusammenhang zwischen der Variable Ausländeranteil und Förderschüler Lernen gibt.
8. Auch Flüchtlinge werden als Ausländer bezeichnet. Gerade Kinder verarbeiten ein Landeswechsel oder eine Flucht anders. r = 0,51 zeigt einen starken Zusammenhang zwischen Ausländeranteil und Förderschüler emotionale soziale Entwicklung, d. h. Je höher der Ausländeranteil einer Stadt, desto höher die Quote der Förderschüler emotionale soziale Entwicklung.
9. Wenn Eltern gut verdienen, gehen sie viel arbeiten und haben dadurch nur wenig Zeit für ihre Kinder. Das kann beim Lernen aber auch bei der emotionalen sozialen Entwicklung Konsequenzen haben. r = 0,86 zeigt einen starken Zusammenhang zwischen Bruttoeinkommen und die Förderschüler Lernen, d. h. Je höher das durchschnittliche Bruttoeinkommen einer Stadt, desto höher die Anzahl der Förderschüler Lernen. r = 0,90 zeigt ebenfalls einen starken Zusammenhang zwischen Bruttoeinkommen und der Anzahl der Förderschüler emotionale soziale Entwicklung, d. h. Je höher das Bruttoeinkommen einer Stadt, desto höher die Anzahl der Förderschüler emotionale soziale Entwicklung.
10. Ausländer wählen eher die Grünen, da diese eher für eine Flüchtlings- und Integrationspolitik stehen.

CDU: r= -0,4

SPD: r= 0,13

Die Grünen: r= 0,22

FDP: r= 0.04

Die Linke: r= -0,49

Andere: r=-0,05

Eine moderate schon fast starke negative Korrelation gibt es bei den Linken, d. h. Je mehr Ausländer eine Stadt, desto weniger werden die Linken gewählt. Auch bei der CDU ist eine moderate negative Korrelation zu sehen, d. h. Je mehr Ausländer in einer Stadt leben, desto weniger wird die CDU gewählt. Eine moderate positive Korrelation ist bei den Grünen zu erkennen, d. h. Je höher der Ausländeranteil einer Stadt, desto eher werden die Grünen gewählt.
11. Die Wohnmiete passt sich dem Einkommen an.

Wohnmiete bis 1948: r= 0.47

Wohnmiete ab 1949: r= 0,65

Wohnmiete Neubau: r= 0,75

Insgesamt zeigen alle drei einen starken (Wohnmiete bis 1948 noch moderaten aber Tendenz zur starken) Zusammenhang, d. h. Je höher das Bruttoeinkommen einer Stadt, desto höher die Mietpreise.
12. Die Wohnmiete orientiert sich an der sozialen Lage einer Stadt.

Wohnmiete bis 1948: r= -0,41

Wohnmiete ab 1949: r= -0,32

Wohnmiete Neubau: r= -0,20

Alle drei zeigen einen negativen Zusammenhang, der schwach bis moderat ausfällt, d. h. Je höher die Arbeitslosenquote, desto geringer die Wohnmiete. 

Anmerkung Mand: Man muss unbedingt vorsichtig mit korrelativen Zusammenhängen umgehen.

Es ist erstens wichtig, ganz genau überlegen, was berechnet wird. Es macht z. B. wenig Sinn, die Anzahl aller Schüler Klasse 1-10 mit der Anzahl aller Einwohner einer Stadt zu korrelieren. Denn das, was man dann weiß , ist ja wenig überraschend. Große Städte haben viele Schüler. In eine ähnliche Richtung gehen möglicherweise auch die Zusammenhänge zwischen Einwohnerzahlen und Arbeitslosenzahlen. Wenn in allen kreisfreien Städten die gleiche Arbeitslosenquote vorläge (also Prozentwerte), dann muss man sogar erwarten, dass große Städte viele Arbeitslose haben. Bei der Berechnung von Korrelationen ist es in diesem Fall also wichtig, Prozentwerte zu berechnen.

Zweite Einschränkung bei Korrelationsstudien. Die gefundenen Zusammenhängen können auf kausale Beziehungen verweisen. Sie müssen es aber nicht. Dass Städte mit vielen Ausländern viele Arbeitslose haben, heißt z. B. weder zwingend, dass es die Ausländer sind, die arbeitslos sind, noch ist klar, wie es zu diesem Befund kommt. Denkbar wäre demnach nicht nur, dass fehlende Schulabschlüsse und Sprachprobleme zu einem Problem von Ausländern auf dem Arbeitsmarkt führen und deshalb in Städten mit vielen Ausländern viele Arbeitslose zu verzeichnen sind. Sondern es ist ebenso gut möglich, dass wenig Angebote auf dem Arbeitsmarkt zur Abwanderung von qualifizierten Arbeitnehmern mit deutscher Staatsbürgerschaft führen. Und an ihre Stelle treten gering qualifizierte Einwanderer, z. B., weil die Mieten niedrig sind. Nennt sich Armutsmigration. Und auch diese Interpretation passt zu den Zahlen. Oder vielleicht ziehen Menschen nicht deutscher Staatsbürgerschaft einfach nur gern in große Städte .

Man muss also wirklich sehr zurückhaltend und vorsichtig formulieren, wenn in Querschnittstudien lediglich korrelative Befunde ermittelt werden. Das, was man tun kann, ist erste Hypothesen entwickeln – mehr nicht.

6. In der sechsten Lerneinheit geht es um Cohen´s Effekstärke (Effektgröße)

Das ist schon ein wichtiger Kennwert, Cohen´s d. Ist nicht schwer zu berechnen. Ist nicht schwer zu interpretieren. Soll helfen zwei Gruppen (z. B. Versuchsgruppe und Kontrollgruppe) oder auch zwei Variablen zu vergleichen. Man benötigt lediglich das Arithmetische Mittel und die Standardabweichung. Und diese Kennwerte teilt ja nun fast jede Studie mit. Cohen´s d wird deshalb gern verwendet, wenn es darum geht, den Stand der Forschung über mehrere Studien hinweg zu untersuchen (in sogenannten Metaanalysen).

Bitte starten Sie mit dem Podcast. Hier finden Sie den Kennwert noch einmal erklärt . Und er wird an einem (fiktiven) Beispiel berechnet: der Aufs-Meer-gucken-Therapie.

Cohens Effektstärke

Das passende SPSS-PSPP-Tutorial bezieht sich auf eine Evaluationsstudie in einem Verbund von Förderschulen. Die Aufgabe war: Entscheiden, ob ein Leseförderungsprogramm angeschafft werden soll.

Cohens-d

Beagle210: 6. Lerneinheit: Cohen’s Effektgröße

Berechnung Cohen’s Effektgröße Richtige Wörter pro Minute:

d = (15,04 – 13,94):9,46= 0,12-> Nach Cohen somit nicht einmal ein schwacher Effekt, da dieser erst ab 0,2 besteht

Berechnung Cohen’s Effekt Falsche Wörter pro Minute:

d = ((-1,24) – (-3,50)):5,09= 0,44-> Könnte man an dieser Stelle sagen, dass es sich hierbei um einen schwachen bis moderaten Effekt handelt? Oder wird dieser nur als schwacher bzw. fast moderater Effekt beschrieben?

Antwort Mand: Die meisten halten sich in der Formulierung an die Empfehlung von Cohen und würden formulieren: Die Studie ermittelt einen geringen Effekt der untersuchten Fördermethode (d = 0,44).

An alle: Interessanter ist vermutlich, was die Befunde bedeuten. Die Lesegeschwindigkeit der Versuchsgruppe vergrößert sich nicht. Aber es entstehen mehr Fehler pro Minute?

Studierende 152020: Bei der Berechnung der Cohens Effektgröße, im Bezug auf die richtigen Wörter pro Minute zwischen Kontrollgruppe und Versuchsgruppe, habe ich das Ergebnis d=0,12 erhalten. Damit handelt es sich um einen geringen Effekt. 

Einen geringen Effekt von d=0,44 ergab sich auch bei der Kontrollgruppe und der Versuchsgruppe mit dem Merkmal falsche Wörter pro Minute.

Ihre Nachfrage/Bemerkung an alle habe ich leider nicht verstanden. Es wäre nett, wenn Sie dies nochmal ausführen könnten.

Anmerkung/Antwort Mand: Ein geringer Effekt beginnt bei 0,2. 0,144 ist kleiner als 0,2. Entsprechend kann man festhalten, dass bei den richtigen Wörtern pro Minute kein Effekt sichtbar wird. Meine Frage zielte auf die Interpretation der Befunde. Was kann man aus den gefundenen Effektstärke nun inhaltlich ableiten? Die wollen ja wissen ob sie das Förderprogramm kaufen sollen. Wie sieht das bisher aus?

Ylvi: ch habe die gleichen Effektstärken errechnet wie meine Vorredner*innen. Zu Ihrer Frage denke ich: Da es sich um negative Mittelwerte handelt, bedeutet das doch, dass die Anzahl der falschen Worte um den entsprechenden Mittelwert gesunken ist.Allerdings wundert es mich, dass die Effektstärke zwsichen den richtigen und den falschen Wörtern sich so wahrnehmbar unterscheidet, da es doch nur möglich ist richtig oder falsch zu lesen. Also müsste der Effekt doch zu beiden Seiten hin gleich stark sein. Bedeutet das dann, das insgesamt weniger Wörter in der Minute gelesen wurden?

Antwort Mand: Ich gebe zu, das ist dreimal um die Ecke gedacht. Aber man muss sich manchmal genau anschauen, was man wie transformiert hat. In den Transformationen wurde berechnet: Posttest minus Pretest. Negative Werte bedeuten hier: Die machen im Pretest mehr Fehler (falsche Wörter) als im Posttest. Oder anders formuliert: Die Zahl der falschen Wörter pro Minute ist durch das Training gesunken. In der Versuchsgruppe liegt das Arithmetische Mittel bei -1,24. In der Kontrollgruppe bei
– 3,5. Das bedeutet: Die falschen Wörter pro Minute in der Kontrollgruppe sinken also deutlicher, und zwar im Umfang eines geringen Effekts.

Haben die beiden Variablen miteinander zu tun? Ein richtiges Wort lesen bedeutet: Es wird ein Wort gelesen, das an der jeweiligen Stelle im zu lesenden Text steht. Ein falsches Wort lesen, bedeutet: Es wird ein Wort gelesen, das an der jeweiligen Stelle nicht im Text steht. Man muss dazu wissen: Lesen ist nach einigen Monaten Unterricht nicht mehr Buchstabe für Buchstabe in Laute umwandeln und dann zu einem Wort zusammenziehen. Sondern Lesen ist die Verifikation und Falsifikation von Silben-, Wort- und Satzerwartungen. Leseanfänger*innen oder schlechte Leser*innen achten manchmal nicht hinreichend genau darauf, ob das Wort, das sie an dieser Stelle vermuten, dort auch wirklich steht. Das Ergebnis ist: Sie lesen vor, was im vorzulesenden Text nicht geschrieben steht. Wenn die falschen Wörter pro Minute abnehmen, dann schauen diese Kinder also genauer hin. Das ist erfreulich. Aber es bedeutet nicht zwingend, dass sich die Zahl der richtigen Wörter pro Minute steigert.

07 Umcodieren

Das ist ziemlich häufig, dass die Daten nicht so sind, wie man sie benötigt. Manchmal ist es z. B. hilfreich, aus Variablen, die intervallskaliert sind nominalskalierte Daten zu machen, etwa weil man die Ergebnisse auch in Kreuztabellen darstellen möchte. Die 7. Sitzung zeigt noch einmal an der Leseförderungs-Studie, wie man hier vorgehen muss.

Umcodieren

Es ist vermutlich hilfreich, sich neben dem Video-Tutorial auch mit dem Podcast zum Thema Kreuztabellen zu befassen.

Kreuztabellen

08 Das achte Tutorial zeigt, wie man Kreuztabellen errechnen lässt und interpretiert.

Kreuztabellen sind ein wichtiges Tool in der empirischen Forschung im Bereich Pädagogik / Soziale Arbeit. Sie stellen nur geringe Ansprüche an die Datenqualität (Nominalniveau), Sie sind leicht zu verstehen. Mit der Chi-Quadrat-Methode (bei Zellengrößen von unter 5: Fisher-Test) steht eine Möglichkeit zur Verfügung zu entscheiden, ob Zusammenhänge oder Unterschiede signifikant sind. Und es gibt sogar mit phi eine Option die Stärke der Zusammenhänge zu messen (Interpretation weitgehend analog zur Interpretation von Korrleationskoeffizienten.

Kreuztabellen

 

Beagle210: Lerneinheit: Kreuztabelle errechnen und interpretieren

Die Ergebnisse der Kreuztabelle für FWpostminuspre01 lauten wie folgt:

  • Bei der Kontrollgruppe sind 44,44% unterdurchschnittlich (Spalte %) und 55,56% überdurchschnittlich. Auch an dieser Stelle teilt es sich ungefähr zur Hälfte auf.
  • Bei der Versuchsgruppe sind 33,33 % überdurchschnittlich und 77,78% überdurchschnittlich. Im Vergleich zur Kreuztabelle RWpostminuspre01 ähneln sich die Ergebnisse in keinster Weise mit der Kontrollgruppe, d. h. sieben von neun Kindern, die mit diesem Fördeprogramm arbeiten weisen mehr falsche Wörter pro Minute auf.
  • Der Wert des Chi-Quadrats lautet 1. Der exakte Wert nach Fischer lautet 0,376 und ist nicht kleiner als 0,05, wodurch kein signifikanter Unterschied vorliegt. Das heißt die Null Hypothese: „Kinder die mit dem Förderpogramm arbeiten unterscheiden sich nicht von Kindern, die mit dem Leseaufbau arbeiten“ bleibt erhalten.
  • Aufgrund der hohen Spaltenprozentzahl im Überdurchschnitt im Vergleich zum Unterdurchschnitt bei den Falschen Wörtern pro Minute denke ich, dass das Förderprogramm nicht gekauft werden sollte. Auch der exakte Wert nach Fischer bestätigt keine signifikanten Unterschiede zwischen den beiden Methoden, vor allem nicht bei den Richtigen Wörtern pro Minute, wodurch man sich die Investition sparen und weiterhin mit der Leseaufbaumethode arbeiten kann.

Mand: Das Förderprogramm heißt: Celeco.

Ich kann das gut nachvollziehen, dass Sie zu diesem Ergebnis kommen. Ich sehe das aber anders.

Richtig: Es gibt keinen signifikanten Unterschied zwischen Versuchs- und Kontrollgruppe. Wichtig für die Bewertung des Programms ist aber, dass – wie im Rahmen der Vorstellung der Studie berichtet – die Kontrollgruppe keineswegs keine Leseförderung erhält (das wäre auch ziemlich problematisch in Förderschulen in der Zeit von Herbstferien bis Osterferien auf Leseförderung zu verzichten). Sondern die Kontrollgruppe erhält eine Leseförderung, die nachweislich effektiv ist (Kieler Leseaufbau). An alle: Welche Bedeutung haben diese Informationen für die Bewertung von Celeco?

Zweitens sollten sich die Teilnehmer*innen des Seminars unbedingt noch einmal die Standardabweichung in Versuchs- und Kontrollgruppe anschauen und auch in die Datenansicht gehen, um die Streuung in der Versuchsgruppe zu interpretieren. Auch hier sind wichtige Einsichten möglich.

Studierende 1520: Ich weiß nicht wieso, aber ich habe einen anderen Wert erhalten als mein_e Vorredner_in.

In der Kontrollgruppe waren 4 Kinder (44,44%) unterdurchschnittlich und 5 Kinder (55,56%) überdurchschnittlich. In der Versuchsgruppe waren wiederum 2 Kinder (22,22%) unterdurchschnittlich und 7 Kinder (77,78%) überdurchschnittlich.

Wie man erkennen kann ist mein Wert zur Versuchsgruppe im Merkmal „unterdurchschnittlich“ anders als im vorherigen Kommentar. Ich kann mir leider nicht erklären, woran das liegt.

Der „Exakte Test nach Fischer“ ergab für die „Exakte Sig. (2-seitig) einen Wert von 0.376. Somit ist der Wert nicht kleiner als 0.05 und es liegt damit kein signifikanter Unterschied zwischen den beiden Gruppen vor. Die Nullhypothese „Es liegen keine Unterschiede zwischen der Kontroll- und der Versuchsgruppe vor“ bleibt somit bestehen. Damit kann inhaltlich festgehalten werden: Kinder, die mit dem Celeco-Programm lernen unterscheiden sich nicht von den Kindern, die mit dem Kieler-Lernprogramm lernen.

Zur Interpretation: Ich würde empfehlen bei dem Kieler Lernprogramm zu bleiben. Aus dem arithmetischen Mittel ist abzulesen, dass die Kinder in der Kontrollgruppe weniger falsche Wörter pro Minute lesen. Auch wenn dies nicht bedeutet, dass sie mehr richtige Wörter lesen, sondern sich wahrscheinlich die Wörter genauer anschauen. Denn es lies sich kein Effekt im Bezug auf die richtigen Wörter nachweisen. Die Streuung um den Mittelwert ist bei den falschen Wörtern bei der Kontrollgruppe ebenfalls geringer (SD 5,09) als bei der Versuchsgruppe (6,70). Bei den richtigen Wörtern ist die Abweichung höher. Dort erlangte die Kontrollgruppe eine Standardabweichung von 9,46 und die Versuchsgruppe von 17,53. Also gehe ich davon aus, dass die Streuung um den Mittelwert bei der Versuchsgruppe höher ist und somit die Ergebnisse der einzelnen Kinder auch heterogener als in der Kontrollgruppe.

Daher würde ich empfehlen bei dem evaluierten Programm des Kieler-Lernprogramms zu bleiben, da die Kinder sich hier anscheinend eher auf das Lesen konzentrieren als bei dem Celeco-Programm.

Antwort Mand: Beagle 210 ist offenbar ein Übertragungsfehler unterlaufen: Anstatt die Spaltenprozente wurden die Zeilenprozente in das Ergebnisprotokoll übertragen.

Bei der Interpretation der Befunde fehlt vielleicht etwas Erfahrung in der Arbeit mit Schüler*innen, die gravierende Lese/Schreibprobleme haben. Manchmal ist man froh, überhaupt irgend eine Methode zu haben, die wirkt. Und vor diesem Hintergrund ist es zunächst eine gute Nachricht, dass man nicht nur auf den nachweislich wirksamen Kieler Leseaufbau zurückgreifen kann, sondern auch auf Celeco. Zweitens muss man bei derart kleinen Stichproben darauf achten, dass mittelwertsbasierte Berechnungen empflindlich auf Ausreißer sind. Aus diesem Grund empfiehlt sich immer ein Blick in die Datenansicht. Die Analyse zeigt: Es gibt einen Ausreißer: Schüler 3. Das Lesen hat sich deutlich verbessert (von 108 auf 166 richtige Wörter pro Minute). Kein anderer Schüler hat einen solchen Leistungssprung gemacht. Man kann also vielleicht vermuten: Hier hat Celeco prima funktioniert.

Es müssen ja nicht alle Kinder auf die gleiche Weise Lesen lernen. Die reagieren positiv auf die Förderung der positiven Bewusstheit – die anderen auf die Förderung der Wortwahrnehmung. Nach dem in der inklusiven und sonderpädagogischen Förderung bedeutsamen Prinzip der Individualisierung sollten Lehrer*innen Kindern, die eher ein Lautwahrnehmungsproblem haben, Förderangebote in Sachen phonologischer Bewusstheit machen. Kinder, die ein Problem mit der Wortwahrnehmung haben, könnten vielleicht von celeco profitieren. Und die Leseförderungsstudie zeigt zumindest exemplarisch: Es gibt solche Kinder. Ich vermute aufgrund der Befunde weiter, dass Probleme in der Lautwahrnehmung vielleicht häufiger sein könnten, als Probleme in der phonologischen Bewusstheit. Aber das ist eine auch auf eignen beruflichen Erfahrungen beruhende Spekulation, mehr nicht.

09: Transformieren als Vorbereitung zur Auswertung eines Soziogramms

Das neunte Tutorial bereitet anhand einer neuen Studie die Auswertung eines Soziogramms vor. Das ist ein mehrschnittiges Verfahren. Die hierzu erforderlichen Schritte werden auf drei Tutorials aufgeteilt, damit das einigermaßen übersichtlich bleibt.

Transformieren wg. Soziogramm

Ein Soziogramm erstellt man normalerweise dann, wenn man die sozialen Beziehungen in einer Gruppe untersuchen will. In diesem Fall sind die Schüler*innen von Inklusionsklassen und Förderschulklassen gebeten, auf einen Zettel drei Namen von Mitschüler*innen zu notieren, die sie besonders gern mögen (Variable: „nett“) und drei Namen von Mitschüler*innen, die sie am wenigsten mögen (Variable „nicht nett“).

Ich orientiere mich in der Auswertung an einem Vorschlag von niederländischen Kolleg*innen. Das Forschungsprojekt basierte auf einer deutsch-niederländisch-österreichische Kooperation. Und da ist es sinnvoll, ähnlich vorzugehen, wie die Kolleg*innen. Im ersten Tutorial zeige ich noch eine etwas kompliziertere Fassung der Auswertungsanweisungen. Im zweiten Tutorial habe ich das noch einmal vereinfacht, damit wir weniger Arbeit haben. Die vereinfachte Fassung finden Sie hier:

Studierende1520: Zur Auswirkung der Verhaltensprobleme auf die Variable „nicht nett“, ist die unabhängige Variable „schwerwiegende Verhaltensprobleme“ und die abhängige Variable ist (die transformierte Variable) „NichtNettproSchuelerzahl“.

Die Kinder die keine schwerwiegenden Verhaltensprobleme haben und als nicht nett bezeichnet wurden erhielten einen Mittelwert von .09

Die Kinder mit schweren Verhaltensproblemen und als nicht nett bezeichnet wurden erhielten einen Mittelwert von 0.34

Damit kann davon ausgegangen werden, dass Kinder mit Verhaltensproblemen eher als nicht nett bezeichnet werden.

Ich habe mich nun gefragt, ob es vielleicht sinnvoll wäre eine Korrelation zwischen „NichtNettVerhaltensproblemen“ und „NettVerhaltensproblemen“ vorzunehmen für eine genauere Darstellung?

Antwort Mand: Sie können natürlich auch eine Korrelation berechnen.

10. Tutorial: Soziogramm-Auswertung Teil 02

Vergleichsweise häufig sind in empirischen Studien komplexe Transformationen notwendig. In der Beispielstudie sind die Berechnungen vereinfacht. Aber in diesem Fall sorgt PSPP für Komplikationen. Denn anders als in SPSS ist eine Verknüpfung von Transformationen in zwei Variablen nicht möglich. Um festzustellen, ob ein Kind beliebt ist oder abgelehnt wird, muss man ja zwei Variablen im Auge behalten: die Variable „nett“ und die Variable „nicht nett“

Transformieren in der Auswertung von Soziogrammen

Ergänzung Mand: Studierende1520 weist in ihrem Kommentar mit Recht darauf hin, dass in dem Tutorial etwas fehlt. Berechnet werden muss ja auch die Variable beliebt2. Habe ich beim Schneiden wohl etwas voreilig rausgeschmissen. Ich bitte um Entschuldigung. Leider bin ich zum gegenwärtigen Zeitpunkt nicht in der Lage, das Video zu überarbeiten. Also kommen hier die erforderlichen Informationen per Text.

Die vereinfachten Auswertungsregeln von DeMonchy &Pijl (s.o.) , sprechen ja dann von beliebten Schülern wenn diese erstens mindestens einmal als „nett“ eingestuft werden (beliebt1). Zweitens ist aber auch erforderlich, dass diese Schüler von keinem Schüler als „nicht nett“ eingestuft werden. Und dies ist die Variable beliebt2. In pspp muss analog zur Berechnung der Variable beliebt 1 transformiert werden. Und dies funktioniert in acht Schritten:
(1) Die Variable „beliebt2“ wird wieder im Menü Umcodieren in andere Variablen erstellt.
(2) Die Ausgangsvariable ist die Variable „nicht nett pro Schülerzahl“). Die klicken Sie im linken Kästchen des Transformationsmenüs an und ziehen diese Variable in das mittlere Kästchen, indem Sie auf das Dreiecksymbol zwischen den beiden Kästchen klicken. Daraufhin erscheint im rechten Kästchen unter der Überschrift ALT die Variable „nicht nett pro Schülerzahl. Diese Variable müssen Sie anklicken (die Variable wird dann blau unterlegt). Unten rechts wird die Ausgabevariable benannt (also die neu zu erstellende Variable) – hier also beliebt2 .
(3) Sie müssen auf „ändern“ klicken. Dies hat zur Folge dass die neue Variable nun im mittleren Feld oben erscheint.
(4) in einem dritten Schritt muss nun angegeben werden, was wie geändert werden soll. Ziel ist ja, das mit 1 codiert wird, wenn die Bedingung erfüllt ist (Der Schüler wird keinmal als „nicht nett“ eingestuft. Und Ziel ist zweitens, dass 0 codiert wird, wenn die Bedingungen nicht erfüllt sind (D.h.: Der Schüler wird mindestens einmal als „nicht nett“ eingestuft). Sie klicken deshalb im mittleren Kästchen auf alte und neue Werte. Daraufhin öffnet sich ein neues Fenster.
(5) In der linken Spalte klicken Sie auf Bereich Kleinster bis Wert und geben hier 0 ein. In der rechten Spalte oben geben Sie dann den Wert 1 ein. Anders formuliert: Sie teilen pspp mit, dass bei Schüler*innen, die nicht als „nicht nett“ eingestuft werden, eine 1 codiert werden soll. Wichtig: Sie müssen noch auf das Feld „Hinzufügen“ klicken. Sonst wird die Transformation gleich nicht durchgeführt.
(6) In der linken Spalte klicken Sie nun auf Bereich bis Größter. Hier geben Sie nun ein 0.001 ein (und markieren damit alle Schüler, die mindestens einmal als „nicht nett“ eingestuft wurden). In der mittleren Spalte müssen Sie dann den Wert 0 eingeben (für: Schüler wurde mindestens einmal als nicht nett eingestuft). Auch hier ist es wichtig, auf das Feld „Hinzufügen“ zu klicken.
(7) In der mittleren Spalte muss man nun auf „weiter“ klicken. Nun ist man wieder im Ausgangsfenster. Die Transformieren-Anweisungen sind abschließend noch einmal mit „ok“ zu bestätigen.
(8) Es empfiehlt sich, abschließend in der Datenansicht zu schauen, ob die Variable „beliebt2“ erstellt wurde (neue Variablen erscheinen immer ganz rechts) und ob diese Variable aus Nullen und Einsen besteht.

Der nächste Schritt (die Addition von „beliebt1“ und „beliebt2“) ist dann wieder im Tutorial enthalten.

11. Tutorial: Feststellen, ob Verhaltensprobleme Auswirkungen auf den Beliebtheitstatus von Förderschüler*innen bzw. Schüler*innen in Inklusionsklassen haben

Der letzte Auswertungsschritt besteht nun darin, die Befunde aus dem Soziogramm in den Systemvergleich von Förderschulen und Inklusionsschulen einzubeziehen. Denn Anlass der Studie war ja die Vermutung, dass für soziometrische Veränderungen nach einer Überweisung in eine Förderschule nicht die pädagogische Arbeit der Förderschullehrer, sondern allgemeine Gesetzmäßigkeiten verantwortlich sind. Das Konzept von Förderschulen besteht ja darin, Klassen aus Kindern zu bilden, die in der Regelschule keinen guten Stand haben. Dabei ist es eher unwahrscheinlich, dass alle (vormals) abgelehnten Schüler in der neuen Gruppe ihren Status behalten.

Beliebtheitstatus von Kindern mit Verhaltensproblemen in Förderschulen und inklusionsschulen vergleichen

Bitte beachten Sie: Durch die nachträglich vorgenommenen Vereinfachungen hat sich leider ein Fehler auch in das 11. Tutorial eingeschlichen. Im Tutorial ist davon die Rede, dass für die Variable „abgelehnt“ fünf Transformationen erforderlich sind. Dies ist in der vereinfachten Fassung so nicht richtig. Es sind – wie bei der Variablen „beliebt“ nur vier Transformationen. Die gelegentlich auf dem Bildschirm erscheinende Variable“abgelehnt1″ berechnet Kennwerte, die für das Tutorial nicht von Bedeutung sind. Bitte einfach ignorieren.

Ylvi: Auch wenn die Ergebnisse sich ein wenig von denen im Tutorial unterscheiden, kann ich doch dieselben Schlüsse ziehen

Schüler mit schwerwiegenden Verhaltensproblemen werden eher abgelehnt, als davon nicht betroffene Schüler. Das Ergebnis ist mit einer Signifikanz von 0,015 hoch signifikant und die Nullhypothese zu verwerfen.

Meine Berechnungen für den GU kommen hier zu derselben Schlussfolgerung. Allerdings ergeben sich folgende Unterschiede

  • Die Stichprobe ist größer. Das muss bei der noch höheren Signifikanz von 0,000 (ich nehme an, es handelt sich um einen gerundeten Wert) berücksichtigt werden.
  • Der Anteil der Schüler mit schwerwiegenden Verhaltensproblemen ist im GU kleiner (11,27% statt 38,04%), d.h., wenn in einer Klasse mit 30 Schülern 3 Schüler statt 11 Schüler mit schwerwiegenden Verhaltensstörungen zu finden sind hat das Auswirkungen darauf inwieweit Verhaltensprobleme von anderen Schüler*innen als „normal“ oder als befremdlich empfunden werden. Das könnte eine Erklärung für den nächsten Punkt sein.
  • Wahrend Beliebtheit und Ablehnung bei Schüler*innen ohne Verhaltensprobleme in beiden Schulformen annähernd gleich verteilt ist Erfahren Schüler*innen mit Verhaltensproblemen im GU deutlich mehr Ablehnung ( 75% gegenüber 54,29%) 

Insgesamt halte ich die den Zusammenhang zwischen Beliebtheit und Verhaltensproblemen für erwartbar, da Verhaltensprobleme die Sozialkompetenz von Kindern durchaus beeinträchtigen kann, was dann schnell zu Ablehnung führen kann. Das dieser Unterschied im GU deutlich größer ist könnte wie oben erwähnt an der unterschiedlichen Verteilung dieser Kinder liegen und vielleicht auch an der Unterschiedlichen Bewertung sozialer Erwünschtheit.

Beagle210 Auch in Inklusionsklassen (gemeinsamer Unterricht) werden Schüler mit schwerwiegenden Verhaltensproblemen häufiger abgelehnt (75%). Der p-Wert beträgt 0,00 und ist kleiner als 0,01, wodurch die Unterschiede hoch signifikant sind. Weiter ist die Nullhypothese in diesem Fall ebenfalls zu verwerfen. Aus diesen Ergebnissen lässt sich vermuten, dass Schüler mit schwerwiegenden Verhaltensproblemen -egal welche Schulform sie besuchen- stets häufiger abgelehnt werden/ unbeliebt sind, als Kinder ohne Verhaltensprobeleme. 

Studierende1520: Ich habe den Gemeinsamen Unterricht einmal für meine Daten, ausgehend von den vorherigen Aufgaben und einmal mit ihren zugesendeten Daten vorgenommen.

Die Ergebnisse für „meine Daten“ sind nicht annähernd, wie Ihre in dem Tutorial. Leider ist mir nicht bekannt warum. 

Daher habe ich es nochmal mit Ihrem Datensatz bearbeitet und der Variable „abgelehnt5“. Auch hier erhalte ich andere Ergebnisse als Sie. Ich gehe davon aus, dass es daran liegt, dass sich bei mir das N in den gültigen und ungültigen Fällen abweichend verhält. So habe ich gültige N 92 und fehlende Werte N 147. Es wäre interessant zu wissen, warum das N abweicht, obwohl ich mit Ihrer Tabelle gearbeitet habe. Da müssten die N doch eigentlich gleich sein.

Zu den Ergebnissen:

In der Förderschule werden Kinder, die keine Verhaltensprobleme zeigen zu 27,2% abgelehnt. Kinder mit Verhaltensproblemen werden zu 55,8% abgelehnt. Die Signifikanz wird mit 0.012 angegeben. Damit kann die Nullhypothese verworfen werden. Somit ist auszugehen, dass Kinder mit schwerwiegenden Verhaltensproblemen aufgrund dessen von anderen Kindern abgelehnt werden.

Für den Gemeinsamen Unterricht ist die Alternativhypothese erst recht anzunehmen, da eine Signifikanz von 0.000 (gerundet) angegeben wird. Damit ist das Ergebnis hoch signifikant. Kinder ohne Verhaltensprobleme werden mit 26,98% abgelehnt. Kinder mit schwerwiegenden Verhaltensproblemen sogar zu 75,0%.

Bezieht man nun die Teilnehmeranzahl mit ein, die der Berechnung zugrunde liegt. Zeigt sich, dass die gültigen Fälle bei dem Gemeinsamen Unterricht (142) viel höher sind, als bei den Förderschulen (92). Danach müsste nochmal geschaut werden, wenn die gültigen N bei der Förderschule gleich hoch wäre, ob sich dort auch nicht eine erhöhte Ablehnung zeigt und ein hoch signifikantes Ergebnis. 

Des Weiteren ist zu überlegen, wie signifikant das Ergebnis bei dem Gemeinsamen Unterricht „wirklich“ ist. Denn schaut man sich die Gesamtergebnisse zwischen Verhaltensproblemen und keine Verhaltensprobleme an, werden von den 142 Kindern (N eingerechnet, da gültig) nur 11,27% der Kinder mit Verhaltensproblemen in der Berechnung aufgenommen. Das sind in absoluten Zahlen 16 Kinder. Im Vergleich dazu haben 126 Kinder keine schwerwiegenden Verhaltensprobleme, aber werden zu 23,94% (34 Kinder) trotzdem abgelehnt. Also würde ich zu dem Schluss kommen, dass Verhaltensprobleme zwar einen wichtigen Grund für die Ablehnung durch andere Kinder sind, jedoch muss es noch weitere Gründe geben.

Antwort Mand: Das ist wirklich komplex mit den Transformationen. Wenn N abweicht, spricht ziemlich viel dafür, dass bei Ihnen einige Werte nicht in die Transformationen eingegangen sind.

12. Sitzung: Probeklausur

Nun steht die Probeklausur an. Das funktioniert so: Sie laden sich die Probeklausur herunter und lassen mir Ihre Antworten als E-Mail-Anhang zukommen. Sie erhalten eine kurze individuelle Antwort von mir. Veröffentlicht werden Ihre Antworten oder mein Kommentar aber nicht. Und je nach Andrang kann es vielleicht etwas länger als gewohnt dauern, bis Sie ich antworte.

13. Sitzung: Ergebnisse der Probeklausur

Frage 17.1.

Nullhypothese: Es gibt keine Gendereffekte bei der Wahrnehmung von Verhaltensstörungen.

Alternativhypothese: Es gibt Gendereffekte bei der Wahrnehmung von Verhaltensstörungen.

Frage 17.2. Die Nullhypothese kann verworfen werden

Frage 17.3 p beträgt 0,004

Die Studie ermittelt hochsignifikante Unterschiede zwischen Lehrerinnen und Lehrern hinsichtlich der Wahrnehmung auffälligen Verhaltens. Lehrer glauben häufiger, dass ihre Schüler Verhaltensprobleme haben.

Frage 17.4 Im Menü Transformieren.

Frage 17.5 Zu berechnen ist:

100/(OhneAbschlMigra + HauptMigra + RealMIgra + Fachabi Migra + AbiMigra) * AbiMigra

und: 

100/(OhneAbschNullmigra + HauptNullmigra + RealNullMigra + FachabiNullMigra+ AbiNullMigra) * AbiNullMigra

8 Gedanken zu „SPSS“

  1. Sehr geehrter Herr Mand,
    „ich stehe etwas auf dem Schlauch“, wie man so schön sagt.
    Welche Daten soll ich denn nun miteinander korrellieren lassen und dann interpretieren? Die Mieten mit den Förderschülern korrelieren lassen, macht doch keinen Sinn, oder? Und die Förderschülerzahlen mit der Gesamtzahl der Einwohnerzahl oder der Ausländer pro Stadt, kann doch auch nicht richtig sein, da ja alle Einwohner/Ausl., auch nicht beschulte Kinder (unter 6 Jahren) und nicht-mehr Beschulte, mit eingeschlossen werden in den Zahlen.
    Oder sollen wir das einfach machen, damit wir das Eingeben üben?

    Antworten
    • Im Prinzip kann man alles mit allem korrelieren. Besser ist es, hypothesen-geleitet vorzugehen. Wie viel Miete pro Quadratmeter in einer Stadt gezahlt wird, sagt etwas über Armut und Reichtum aus. In Köln ist die Altbaumiete sicher höher als in Gelsenkirchen, oder? In großen Städten könnten andere Verhältnisse an den Schulen herrschen als in kleinen. Und richtig: Der Ausländeranteil pro Stadt ist nicht gleichbedeutend mit dem Ausländeranteil in den Schulen. Aber wenn nur die eine Zahl veröffentlicht, kann man ja dennoch schauen, ob es einen Zusammenhang gibt, oder?

      Antworten
  2. Sehr geehrter Herr Prof. Dr. Mand,
    ich wollte mich nun an die Aufgabe machen und erst einmal die Prozentzahlen errechnen. Nun habe ich geschaut, welche Zahlen gegeben und welche noch nicht in Prozentwerten vorhanden sind. Ich frage mich nun, ob ich die richtigen Zahlen benutzte.
    Für die Schüler insgesamt Frage ich mich, ob ich als N die EInwohnerzahlen nehmen soll.
    Für die Förderschüler (2 Gruppen) würde ich als N die Variable sz1bis10 benutzen.
    Für Arbeitslose und einkstpf würde ich als N die Einwohnerzahlen nehmen.

    Für Einwohnerzahlen, Mieten und Bruttoeinkommen fällt mir kein N ein. Da es ja zu Fehlern kommen kann, wenn ich diese nicht in % umwandle, weiß ich nicht, ob ich diese dann in die Berechnung mit einnehmen kann. Oder soll ich sie, zur Übung, einfach die Zahlen korrelieren lassen?

    Antworten
    • Hallo Studierende 152020,
      sz 1bis10 sind alle Schüler von Klasse 1 bis 10. Das ist ihre Grundgesamtheit für alle Prozentwerte im Schülerbereich. Sie können für die Arbeitslosen die Einwohnerzahlen nehmen. Das ist zwar anders als das die Bundesagentur macht, aber auch sinnvoll (Arbeitslose pro Einwohner). Die Mieten sind Quadratmeterpreise. Und das Bruttoeinkommen ist das arithmetische Mittel pro Stadt. Da ist es nicht sinnvoll Prozentwerte zu berechnen. Sie könnten ja z. B. LBproz und Miete korrelieren bzw. eproz und ei.
      Gruß
      J. M.

      Antworten
        • Ok, das war vielleicht ein wenig kurz. Es ist sinnvoll, die Zahlen zum sonderpädagogischen Förderbedarf bzw. zu Förderschülern in Prozentzahlen zu transformieren – ähnlich wie wir das bereits bei den Ausländerquoten getan haben. Sie könnten z. B. 100/Schuelerzahl1bis10*lb als Variable berechnen lassen. Dann haben Sie ja Prozentwerte. Und diese neue Variable (mein Vorschlag Lbproz) – wie auch immer Sie die nennen wollen, könnten Sie z. B. mit den Mietvariablen korrelieren.

          Antworten
  3. Zur Frage an Alle – 6. Einheit

    Ich würde es jetzt so interpretieren, dass ich vom Kauf abraten würde. Denn es gibt keinen Effekt im Bezug auf richtige Wörter und einen geringen Effekt bei falschen Wörtern pro Minute. Das würde mich persönlich nicht überzeugen das Programm als neue Methode einzuführen. Sondern ich würde nach einer anderen Methode mit höheren Effekten suchen.

    Antworten
  4. Sehr geehrter Herr Prof. Dr. Mand,

    ich habe mir gerade das Tutorial angeschaut und wollte eigtl. nun die Aufgabe machen. Mir ist aufgefallen, dass eine Erklärung zu der Variable „beliebt2“ fehlt. Da ich die aber brauche für „beliebt3“, wollte ich nun anfragen, wie ich „beliebt2“ erhalte.
    Ich habe mir das Tutorial an der Stelle zwischen „beliebt1“ und „beliebt3“ nochmal angeschaut und habe keinen Hinweis gefunden. Dort ist aber zu sehen, dass das Tutorial anscheinend zusammen geschnitten wurde. Fehlt vielleicht deshalb die Erklärung? Oder habe ich es übersehen an einer anderen Stelle?

    Antworten

Schreibe einen Kommentar