Der
Zufall mag blind sein, das Zufallsprinzip hat Methode
Zufallsprozeduren in den Sozialwissenschaften
Innerhalb der Sozialwissenschaften wird der Zufall häufiger eingesetzt.
So wird z.B. eine repräsentative Zufallsstichprobe aus der Population
gezogen, um mit Hilfe von Statistiken bestimmte Parameter in der Population
(etwa den Mittelwert) zu schätzen. Dabei handelt es sich um eine Zufallsziehung
von Personen aus einer Population. Zum anderen werden Versuchspersonen
bestimmten Bedingungen nach Zufall zugeordnet (Randomisierung). Schließlich
wird gelegentlich nach Zufall bestimmt, welche Untersuchungsgruppe welche
experimentelle Bedingung erhält. Aus einer Menge möglicher Reize
werden einige nach Zufall ausgewählt, um sie den Vpn zu präsentieren.
In einem lehrzielorientierten Test wird nach Zufall entschieden, welche
Aufgaben aus der Grundmenge aller möglichen Aufgaben in den Test aufgenommen
werden. Bei MC-Aufgaben wird die Position der richtigen Alternative nach
Zufall bestimmt. Diese Zufallsprozesse verfolgen verschiedene Zwecke und
die Unterschiede sollten einem bewusst sein.
Was wird bei der Randomisierung randomisiert
?
Ziehung einer Zufallsstichprobe
Zu Beginn eines Versuchs erscheint es ratsam darüber nachzudenken,
auf welche Population man die Ergebnisse später generalisieren will.
Sofern möglich, rekrutiert man seine Vpn, indem man zunächst
aus der definierten Population eine Zufallsstichprobe zieht und diese Stichprobe
als seine Untersuchungsstichprobe (=diejenigen Vpn, die für die Untersuchung
zur Verfügung stehen) betrachtet. Mit dieser Zufallsauswahl verfolgt
man lediglich den Zweck, repräsentative Ergebnisse über die Population
zu erhalten, die später eine bessere Generalisierung der Befunde auf
die Population ermöglichen.
Für die interne Validität ist eine derartige Repräsentativität
nicht erforderlich.
Die Zufallsziehung einer Untersuchungsstichprobe aus
der Population hat nichts mit Randomisierung zu tun. Meistens kann man
in der Forschungspraxis gar keine Vpn aus einer definierten Population
auswählen, sondern ist froh, wenn man überhaupt Vpn bekommt (Gelegenheitsstichprobe,
Ad-hoc-Stichprobe, Convenience Sampling). Welche Untersuchungsstichprobe
auch immer zugrunde liegt, die Vpn in dieser Untersuchungsstichprobe lassen
sich randomisieren.
Randomisierung
Die entscheidende Randomisierung ist die Randomisierung der Vpn
auf die am Versuch beteiligten Gruppen. Dabei werden die Versuchspersonen
der gesamten Untersuchungsstichprobe nach Zufall den einzelnen experimentellen
Untersuchungsgruppen oder direkt den einzelnen experimentellen Bedingungen
zugeteilt.
Es empfiehlt sich jedoch, wenn möglich zusätzlich
zu der Randomisierung der Vpn zu den Untersuchungsgruppen auch durch Zufall
festzulegen, welche Untersuchungsgruppe welche experimentelle Bedingung
erhalten soll. Die Randomisierung der experimentellen Bedingungen zu den
Untersuchungsgruppen ist zwar nicht unbedingt notwendig und hat gar nichts
mit der Randomisierung der Vpn zu tun, verhindert aber eine subjektive
Beeinflussung durch den Forscher, der möglicherweise eine bestimmte
Bedingung mit ganz bestimmten Vpn favorisiert und dadurch vielleicht unbewusst
einen Versuchsleitereffekt produzieren kann.
Sonderfälle:
Zufällige Zuteilung der Vpn zu den experimentellen
Gruppen ist dasselbe wie zufällige Zuteilung der experimentellen Bedingungen
zu den Versuchspersonen. Bei einem WWW-Experiment werden nicht erst alle
Vpn gesammelt und dann erst randomisiert, sondern der Vp, welche zum Experiment
antritt, wird nach Zufall eine experimentelle Bedingung zugeordnet.
Man könnte auch direkt aus der Population die Versuchspersonen
zu den experimentellen Bedingungen zuordnen, indem man so viele Zufallsstichproben
zieht, wie man Bedingungen hat, aber das hier dargestellte Verfahren erscheint
durchsichtiger und effizienter.
Zweck und Effizienz der Randomisierung
Zweck der Randomisierung ist es, die Vergleichbarkeit der Personen
in den experimentellen Gruppen hinsichtlich aller denkbaren Personenvariablen
und untersuchungsirrelevanten Einflüssen zu ermöglichen. Die
Randomisierung ist die einzige Methode, welche sowohl bekannte wie unbekannte
Störfaktoren kontrollieren kann. Das bedeutet auch, dass die Gruppen
aus vergleichbaren Umwelten stammen und z.B. innerhalb eines längeren
Untersuchungszeitraums vergleichbaren sonstigen externen Einflüssen
ausgesetzt sind.
Weil es nur um Vergleichbarkeit der Gruppen, nicht aber um Repräsentativität
der Gruppen für irgendwelche Populationen geht, kann man die Randomisierung
mit beliebigen Untersuchungsstichproben (auch mit Extremgruppen, z.B. hochgradig
Neurotischen, Schwachsinnigen, Professoren) durchführen. Entscheidend
ist dann, dass in den experimentellen Gruppen z.B. vergleichbare Schwachsinnige
sind, nicht dass diese Schwachsinnigen repräsentativ für die
Bundesrepublik sind.
Da jede Randomisierung mit Zufallsfehlern behaftet ist, garantiert die
Randomisierung die Vergleichbarkeit nicht, aber sie gewährleistet
eine Vergleichbarkeit innerhalb bestimmter statistischer Fehlergrenzen.
Anders ausgedrückt: Werden die Vpn nach Zufall auf 2 Gruppen aufgeteilt,
dann sollten mögliche Unterschiede zwischen den Gruppen hinsichtlich
aller möglichen Variablen nur zufallsbedingt infolge von Stichprobenfehler
sein, d.h. sich bis auf den Alphafehler nicht signifikant voneinander unterscheiden.
Die Effizienz der Randomisierung hängt ab von
-
der Homogenität/Heterogenität der Vpn einschließlich ihrer
Umwelten und
-
der Gruppengröße (n pro Versuchsgruppe)
Je homogener die Vpn, desto effizienter die Randomisierung. Die Homogenität
der Vpn ist jedoch schwer hinsichtlich aller möglichen Variablen einzuschätzen,
womit der Gruppengröße als einer direkt beeinflussbaren Größe
eine stärkere Bedeutung zukommt.
Die Effizienz der Zufallszuteilung ist bei geringer Gruppengröße
(n<=10) ziemlich gering. (siehe nicht notwendiger Exkurs:Simulation:
Randomisierung
auf EG und KG ). Die Vergleichbarkeit der Personenmittelwerte (für
jede Personenvariable) in den einzelnen Gruppen wächst gemäß
den statistischen Gesetzmäßigkeiten mit der Größe
der experimentellen Gruppen. Die statistisch zu erwartende Unterschiedlichkeit
der Mittelwerte in beiden Bedingungen kann unter bestimmten Voraussetzungen
mit Hilfe des Standardfehlers der Mittelwertsdifferenzen von EG und KG
eingeschätzt werden. (siehe: nicht notwendiger Exkurs: "Wie
stark unterscheiden sich die experimentellen Gruppen unmittelbar nach der
Randomisierung ?" ). Da eine verbindliche Mindestgruppengröße
schwerlich quantifiziert werden kann, sollte man aus Sicherheitsgründen
möglichst viele Probanden heranziehen [Empfehlung: mindestens 30 pro
Gruppe). Es empfiehlt sich, die Effizienz der tatsächlich durchgeführten
Randomisierung an mehreren Variablen zu kontrollieren. Relativ leicht verfügbar
sind Angaben von Personen wie Alter, Geschlecht und Schulbildung.
Randomisierungsverfahren: Wie funktioniert
Randomisierung?
Zufällige Zuweisung der Vpn auf die experimentellen Gruppen bedeutet,
dass jede Vp die gleiche Chance hat, zu einer der Bedingungen zugeordnet
zu werden. Man kann sich dies in etwa so vorstellen: Sollen N Vpn auf 2
Bedingungen zugeteilt werden, so gibt es x Möglichkeiten, die Vpn
auf zwei Bedingungen zuzuteilen. Der Zufall entscheidet nun, welche dieser
x Möglichkeiten ausgewählt wird. (siehe nicht notwendiger: Exkurs:
"Wie viele Möglichkeiten
gibt es, N Probanden auf k Gruppen zuzuteilen? )
Die Zuweisung einer Versuchsperson darf in keinster Weise von irgendwelchen
nicht zufälligen Bedingungen abhängig gemacht werden. Es darf
z.B. nicht vorkommen, dass Versuchspersonen, die sich etwas verspätet
haben, nicht mehr zu der ersten Bedingung zugeordnet werden können,
weil diese Bedingung schon realisiert wurde. Denn dann hätten die
zu spät gekommenen Versuchspersonen und nicht der Zufall bestimmt,
dass sie nicht in die erste Bedingung kommen. Die Zufallszuteilung ist
ein methodisches Prinzip, das strikt eingehalten werden muss. Vieles,
was umgangssprachlich als zufällig bezeichnet wird, ist nicht strikt
zufällig, sondern erscheint nur so.
Man rate bei insgesamt 3 Bedingungen für jede Versuchsperson,
welche Bedingung sie erhält. In the long run darf man nicht deutlich
mehr als 33,3% richtige Vorhersagen machen. Macht man dennoch zuverlässig
signifikant mehr richtige Prognosen, dann gibt es nur 2 Möglichkeiten:
1. Das Zufallsprinzip wurde falsch angewandt.
2. Man verfügt über die Fähigkeiten eines
Hellsehers.
Sie können ja einmal überprüfen,
ob
Sie ein Hellseher sind.
Spezialfall: Erst parallelisieren und dann randomisieren
Dieses, gelegentlich auch eingeschränkte Randomisierung genannte
Verfahren ist im Endeffekt der Randomisierung vergleichbar, weil jede Vp
die gleiche Chance hat, zu einer der Bedingungen zugeordnet zu werden.
Anschauliches Beispiel für eine korrekte Randomisierung
60 Vpn sollen auf 3 Bedingungen (A,B,C) nach Zufall zugeteilt werden:
Variante 1
Es existiere eine numerierte Liste mit den 60 Namen der Vpn
Man nimmt 60 Karteikarten und schreibt auf je 20 Karten die Buchstaben
A, B oder C.
Anschließend mischt man die Karten ganz gut durch.
Nun ordnet man der ersten Vp in der Liste die Bedingung auf der ersten
Karte zu, der zweiten Vp in der Liste die Bedingung auf der zweiten Karte
usw.
Statt Karteikarten kann man natürlich auch Zettel (aber gleiche
Zettel) verwenden, diese in einer Urne gründlich herumschütteln
und dann die Reihenfolge durch blindes Herausziehen der Zettel erreichen.
Variante 2
Ich nehme 60 Karteikarten, schreibe die Namen der Vpn auf je eine Karte.
Anschließend mische ich die Karten. Dann bestimmte ich.
Karte 1 zu A
Karte 2 zu B
Karte 3 zu C
Karte 4 zu A
Karte 5 zu B
..............
Aufgabe:
12 Vpn sollen nach Zufall auf die Bedingung EG und KG verteilt werden.
Berechnen Sie den Mittelwert der Intelligenz und der Abiturnote für
EG und KG
Die Prozedur kann mehrmals wiederholt werden. Sofern die Aufgabe in
Gruppen bearbeitet wurden, können die einzelnen Ergebnisse dann gemeinsam
dargestellt werden:
Verschiedene Durchgänge erbringen etwas unterschiedliche Ergebnisse.
Kennen Sie möglicherweise aus der Statistik eine Größe,
welche die Unterschiedlichkeit der Ergebnisse einschätzen lässt
?
VP
|
Intel-
ligenz
|
Abitur
note
|
A
|
120
|
1.8
|
B
|
100
|
3.2
|
C
|
89
|
3.4
|
D
|
102
|
3.1
|
E
|
93
|
3.7
|
F
|
115
|
2.4
|
G
|
108
|
2.2
|
H
|
96
|
2.9
|
I
|
90
|
3.1
|
J
|
88
|
3.6
|
K
|
104
|
2.8
|
L
|
93
|
3.5
|
Sie können ein Aufgabenblatt zur Aufgabe
ausdrucken
Sie können die Daten aus Excel verwenden
Wie stelle ich Zufall systematisch her ?
Obige Beispiele sollten das Prinzip veranschaulichen, sind aber nicht
in jedem Falle zu empfehlen, da etwa vollständiges Durchmischen möglicherweise
nicht so ohne weiteres gewährleistet ist (siehe z.B. die eigens konstruierte
und gut überwachte Maschine zur Ermittlung der Lottozahlen). Aus diesem
Grunde gibt es Zufallstafeln oder Programme, die zufällige Zahlen
erzeugen.
Mit Hilfe von Zufallsprogrammen kann man sich das Mischen sparen und
z.B. direkt eine Zufallsreihenfolge herstellen lassen. Für die oben
angegebene Aufgabe, bei der 12 Vpn auf 2 Gruppen aufgeteilt werden sollten,
hat ein Programm beispielsweise die folgende Reihenfolgen vorgeschlagen:
1, 2, 12, 3, 9, 7, 6, 4, 5, 10, 11, 8,
Diese könnte man nun in unterschiedlicher Weise nutzen, die Vpn
zuzuteilen, z.B.:
-
die ersten 6 in EG, die zweiten 6 in KG oder
-
die ungeraden Reihenfolgenummern in EG, die geraden Reihenfolgenummern
in die KG. Dann würde in die EG folgende Vpn-Nummern fallen
1,12,9,6,5,11
Mit Hilfe eines Randomizers kann man beliebig viele Reihenfolgen anfordern:
(hier weitere 5 Anordnungen)
8, 10, 2, 7, 6, 9, 5, 3, 11, 4, 1, 12,
4, 9, 5, 2, 3, 8, 6, 1, 12, 7, 11, 10,
4, 12, 10, 9, 3, 2, 1, 5, 11, 7, 8, 6,
8, 4, 2, 9, 12, 7, 5, 1, 3, 10, 11, 6,
10, 6, 1, 8, 7, 11, 3, 5, 4, 9, 2, 12,
Man komme aber nicht auf die Idee, solange Zufallsfolgen
anzufordern, bis man eine gefunden hat, die einem gefällt. Wenn man
schon mehrere zieht, dann sollte der Zufall wiederum entscheiden, welche
Zufallsfolge herangezogen werden soll
Das JavaScript auf der Seite zufällige
Zuteilung von Versuchspersonen (Vpn) zu den experimentellen Gruppen
ermöglicht eine direkte Randomisierung aller Vpn auf die experimentellen
Gruppen. Dort gibt man die Anzahl der verfügbaren Vpn (also N der
Untersuchungsstichprobe) sowie die Anzahl der experimentellen Gruppen (Bedingungen)
ein. Das JavaScript teilt dann die Vpn nach Zufall auf die möglichen
Gruppen.
Was ist keine Randomisierung
?
Sie wählen nach Zufall 2 Schulklassen aus der Population aller
Schulklassen und betrachten diese beiden Klassen als ihre Untersuchungsstichprobe.
Dann ermitteln Sie durch Münzwurf, welche Klasse EG und welche Klasse
die KG bilden.
Hier werden nicht Versuchspersonen, sondern Klassen nach
Zufall gezogen, und die Bedingungen nach Zufall den Klassen, nicht den
Schülern zugeordnet. In den zufällig gezogenen Klassen können
sich sehr wohl ganz unterschiedliche Schüler befinden (z.B. Klasse
A besucht eine 'von der Oberschicht favorisierte Eliteschule', Klasse B
stammt aus 'einer Restschule in der Nähe eines sozialen Brennpunktgebietes'
)
Aus einem Telefonbuch werden nach Zufall 2 Seiten gezogen. Die Personen
auf der einen Seite gehören zur EG, die auf der anderen Seite zur
KG.
Auch hier werden nur 2 Gruppen nach Zufall gezogen und
nicht die Einheiten, die eigentlich nach Zufall gezogen werden müssten.
Gruppe A könnte aus einem anderen Ort stammen als Gruppe B. Selbst
wenn beide Gruppen aus dem gleichen Ort kämen, wäre auch denkbar,
dass die alphabetische Ordnung der Namen im Telefonbuch die Personen
eben nicht hinsichtlich aller möglichen Merkmale nach Zufall auflistet,
sondern Personen, deren Namen mit A beginnen sich von Personen, deren Namen
mit O beginnt, unterscheiden.
Sie bestimmen, dass die Vpn, die zufällig zuerst zum Versuch
erscheinen in die KG, die restlichen in die EG kommen.
In diesem Fall könnten die ersten Vpn keineswegs
zufällig als erste erschienen sein und sich von den letzten Vpn z.B.
im Hinblick auf ihre Pünktlichkeit unterscheiden.
Auch wenn man häufig nicht den geringsten Verdacht hegt, die Gruppen
würden sich irgendwie unterscheiden, ist das strikt zufällige
Verfahren immer einem "zufällig erscheinenden Zuteilungsverfahren"
vorzuziehen, da es systematisch Vergleichbarkeit herstellt.
Überprüfung des Erfolgs einer Randomisierung
Da die Randomisierung die Vergleichbarkeit der Gruppen nicht
garantieren kann, sondern lediglich wahrscheinlich macht, empfiehlt es
sich, die Vergleichbarkeit der Gruppen an verfügbaren Daten zu überprüfen.
Als relevante Kontrollvariablen eignen sich vornehmlich nachgewiesene Störvariablen,
also solche Variablen, welche die abhängige Variable stark beeinflussen
und in der Regel mit dieser recht hoch korrelieren. Unterscheiden sich
die experimentellen Gruppen hinsichtlich dieser Kontrollvariablen nicht
signifikant voneinander, so sind gewisse Indizien für den Erfolg der
Randomisierung erbracht worden.
Beispiel
UV = Motivationsmethode (A, B) zur Steigerung der Konzentration im
Diktat.
AV = Fehler im Diktat
potentiellen Störvariablen = bisherige Leistung im Fach Deutsch,
Rechtschreibfähigkeit, Alter
Die Versuchspersonen werden nach Zufall auf zwei Gruppen aufgeteilt.
und dann überprüft, ob sich beide Gruppen hinsichtlich Deutschnoten,
Rechtschreibtest und Alter signifikant unterscheiden. Entscheidend ist,
dass die zur Kontrolle herangezogenen Variabeln vor der experimentellen
Manipulation gemessen wurden, bzw. durch die UV nicht beeinflusst
werden können. Dann erscheint es aber auch überlegenswert, die
Vergleichbarkeit hinsichtlich wichtiger Störvariablen zu garantieren
und darüber hinaus zu randomisieren. (siehe: empfehlenswerter Exkurs: "Randomisierung
mit anderen Kontrollmethoden kombinieren! )
Zusammenfassung:
-
Unter Randomisierung (als Kontrolltechnik) versteht man die zufällige
Zuteilung der Versuchspersonen zu den experimentellen Gruppen. Die Repräsentativität
der Untersuchungsstichprobe spielt dabei keine Rolle. Jede beliebige (auch
extreme) Untersuchungsstichprobe lässt sich randomisieren.
-
Die Zuteilung der Vp zu den experimentellen Gruppen muss strikt nach
Zufall erfolgen, was durch ein systematisches Zufallszuteilungsverfahren
vor Beginn des Versuchs sichergestellt werden muss.
-
Sinn der Zufallszuteilung ist es, die experimentellen Gruppen hinsichtlich
aller Personen bedingter Unterschiede sowie aller versuchsirrelevanten
Umwelteinflüsse, denen sie ausgesetzt sind, vergleichbar zu machen.
-
Die Randomisierung garantiert keine absolute Vergleichbarkeit und ist insbesondere
bei kleinen Gruppengrößen nicht hinreichend. Die Effizienz der
Randomisierung steigt mit wachsender Anzahl der Vpn pro Gruppe. Nach Möglichkeit
sollte der Erfolg der Randomisierung anhand von verfügbaren Kontrollvariablen
überprüft werden.
-
Das Verfahren "erst parallelisieren, dann randomisieren", ist ebenfalls
eine Form der Randomisierung.
-
Die Randomisierung ist das wichtigste Kontrollprinzip in der Versuchsplanung.
Sie ist die einzige Methode, die alle bekannten und unbekannten Störfaktoren
kontrolliert.
Arbeitsanregung: Praktischer
Randomisierungsversuch im Seminar
created 4.12. 1997; last update 27.5.2004; Bernhard
Jacobs, b.jacobs@mx.uni-saarland.de