Die Binomialverteilung beschreibt unabhängige Zufallsversuche mit Erfolg und Misserfolg. Sie wird durch eine Formel mit Erfolgswahrscheinlichkeitp, Anzahl der Versuchen und Erfolgenk berechnet. Entdecke, wie sich die Verteilung bei zunehmenden n verändert! Interessiert? Lies hier mehr!
Die Normalverteilung ist eine Wahrscheinlichkeitsverteilung. Sehr viele statistisch gestreute Merkmale, Ereignisse und Abläufe auf der Welt und im Universum können durch die Normalverteilung abgebildet werden.
Eine Zufallsgröße ist normalverteilt, wenn ihre Wahrscheinlichkeitsverteilung die Form einer Gauß’schen Glockenkurve annimmt.
Wie der Name der Gauß’schen Glockenkurve vermuten lässt, geht die Normalverteilung auf den Mathematiker Carl Friedrich Gauß zurück.
Wusstest du schon?
Die Normalverteilung ist ein Grundpfeiler der Statistik und wird in vielen Bereichen genutzt, von der Biologie über die Wirtschaft bis hin zur Psychologie. Zum Beispiel hilft sie dabei, herauszufinden, wie sich die Intelligenz in einer Gruppe verteilt oder wie Aktienkurse schwanken. Ohne sie wäre vieles unvorhersehbar!
Normalverteilung – Glockenkurve
Die Form der Gauß’schen Glockenkurve ist für jede normalverteilte Zufallsgröße näherungsweise gleich. Der Erwartungswertμ bestimmt, um welchen Wert die Glockenkurve positioniert ist (also wo das Maximum liegt) und die Standardabweichungσ beeinflusst die Breite der Glockenkurve.
Die gesamte Fläche unter der Gauß’schen Glockenkurve entspricht genau dem Wert 1. Das bedeutet, die Summe der Wahrscheinlichkeiten aller möglichen Ergebnisse (= Werte der Zufallsgröße) ergibt den Wert 1, also 100%. Das ist eine wichtige Voraussetzung für eine sinnvolle Interpretation der Wahrscheinlichkeiten.
Teste dein Wissen zum Thema Normalverteilung!
1.215.161 Schülerinnen und Schüler haben bereits unsere Übungen absolviert. Direktes Feedback, klare Fortschritte: Finde jetzt heraus, wo du stehst!
Noch nicht angemeldet?
Jetzt registrieren und vollen Zugriff auf alle Funktionen erhalten!
Normalverteilung – Unterschied zur Binomialverteilung
Es gibt einen Zusammenhang zwischen Normalverteilung und Binomialverteilung:
Die Normalverteilung kann als Verallgemeinerung der Binomialverteilung für sehr große n angesehen werden.
Das bedeutet, dass sich die Wahrscheinlichkeitsverteilung einer binomialverteilten Zufallsgröße bei sehr vielen Versuchen einer Gauß’schen Glockenkurve annähert. Die Gültigkeit dieser Näherung beschreibt der Satz von De Moivre und Laplace.
Für kleinere n ist allerdings ein wesentlicher Unterschied zwischen Normalverteilung und Binomialverteilung zu beachten:
Die Binomialverteilung ist eine diskrete Wahrscheinlichkeitsverteilung. Das heißt, mit ihr wird eine Zufallsgröße beschrieben, die konkrete, isolierte, ganzzahlige Werte annimmt. Es gibt beispielsweise genau 0,1,2,3 (oder mehr) Treffer.
Die Normalverteilung ist hingegen eine stetige Wahrscheinlichkeitsverteilung. Das heißt, dass die Zufallsgröße (theoretisch) jede beliebige reelle Zahl als Wert annehmen kann. So ist beispielsweise die Größe von Pflanzen näherungsweise normalverteilt: Es ist nicht nur jede Größe in Millimetern, Zentimetern und Metern möglich, sondern auch alle Größen dazwischen, die durch Kommazahlen dargestellt werden können – jedenfalls bis zu einer bestimmten Maximalgröße (da Pflanzen nicht unendlich wachsen können).
Wiederholung der Binomialverteilung
Mithilfe der Binomialverteilung können wir eine bestimmte Art von Zufallsversuchen beschreiben, die wiederholt ausgeführt werden. Dabei müssen die einzelnen Versuche voneinander unabhängig sein. Außerdem wird bei den Versuchen nur zwischen zwei möglichen Ausgängen, Treffer und Nichttreffer (bzw. Erfolg und Misserfolg), unterschieden.
Die Binomialverteilung Bn,p(k) bzw. die Wahrscheinlichkeitsverteilung P(X=k) einer binomialverteilten Zufallsgröße kann mit der folgenden Formel berechnet werden:
p: Trefferwahrscheinlichkeit/Erfolgswahrscheinlichkeit eines einzelnen Versuchs
n: Anzahl der Versuche
Wir können uns zum Beispiel einen Würfelwurf vorstellen, bei dem wir nur zwischen geraden und ungeraden Zahlen unterscheiden. Eine gerade Zahl, also 2,4,6, werten wir als Erfolg, wohingegen eine ungerade Zahl, also 1,3,5, als Misserfolg gewertet wird. Die Erfolgswahrscheinlichkeit p ist damit genau 21, also:
p=21
Für jede Anzahl an Wiederholungen n können wir ein Histogramm der Wahrscheinlichkeitsverteilung zeichnen. Bei kleinen Zahlen, beispielsweise n=2, können wir die Wahrscheinlichkeiten noch per Baumdiagramm veranschaulichen. Probier’ das gerne einmal selbst zu Hause aus.
Im Fall des Würfels ist bei n=2 die Wahrscheinlichkeit für null Treffer gleich 41, die Wahrscheinlichkeit für einen Treffer gleich 21 (weil entweder der erste oder der zweite Wurf ein Treffer sein kann) und die Wahrscheinlichkeit für zwei Treffer beträgt 41. Aufsummiert ergibt sich eine Wahrscheinlichkeit von eins, was 100% entspricht. Für größere n verändert sich die Gestalt des Histogramms, wie in der folgenden Abbildung zu sehen ist:
Hier ist jeweils auf der x‑Achse die Anzahl der Treffer r aufgetragen und auf der y‑Achse die zugehörige Wahrscheinlichkeit P(r).
Wird die Anzahl der Versuche (bzw. Wiederholungen) n größer, wird das Histogramm breiter, flacher und um den Erwartungswert symmetrischer. (Im Fall des Würfelwurfs ist die Verteilung von Anfang an symmetrisch, weil die Wahrscheinlichkeiten für Treffer und Nichttreffer in unserem Zufallsversuch gleichermaßen 21 betragen.)
Für ausreichend große n lässt sich jede Binomialverteilung durch eine spezielle Verteilungsfunktion annähern: die Normalverteilung. Das ist insbesondere praktisch, weil verschiedene Histogramme so besser vergleichbar werden. Außerdem ist es mithilfe der Normalverteilung einfacher, Wahrscheinlichkeitswerte für sehrgroße n zu bestimmen.
Also schauen wir uns die Normalverteilung genauer an.
Normalverteilung und Standardnormalverteilung
Mithilfe der Normalverteilung können sehr viele verschiedene Zufallsversuche abgebildet werden.
Im Gegensatz zur Binomialverteilung handelt es sich hierbei aber um eine stetige Wahrscheinlichkeitsverteilung. Das bedeutet, dass die betrachtete Zufallsgröße kontinuierliche verteilte Werte annehmen kann. Das machen wir uns am besten an einem Beispiel klar:
Kennst du das?
Vielleicht hast du schon einmal bemerkt, dass die meisten Menschen durchschnittlich groß sind, während sehr große oder sehr kleine Menschen seltener vorkommen. Diese Beobachtung lässt sich durch die Normalverteilung erklären. Sie zeigt, dass die meisten Werte bei kontinuierlichen Zufallsgrößen um den Mittelwert konzentriert sind, während extrem niedrige oder hohe Werte seltener auftreten. So hilft dir die Normalverteilung, die Verteilung von Eigenschaften in der Bevölkerung besser zu verstehen.
Die Körpergröße ist eine annähernd normalverteilte Größe. Diskret verteilt wäre die Körpergröße, wenn beispielsweise nur die Werte 1,60m, 1,70m, 1,80m und so weiter möglich wären. Das ist aber natürlich Quatsch! Es gibt auch Menschen, die 1,61m oder 1,752m groß sind.
Grafisch dargestellt sehen die Verteilungen der Körpergröße in Deutschland für über 18‑jährige Personen, differenziert nach dem biologischen Geschlecht, folgendermaßen aus:
Das ist (aufgrund der vielen Möglichkeiten und der vielen Werte) eine kontinuierliche Verteilung. Es gibt keine Sprünge oder Unterbrechungen. Hier siehst du auch die typischen Form der Kurve, die eine Normalverteilung beschreibt – die Gauß'sche Glockenkurve.
Die Binomialverteilung ist eine diskrete Wahrscheinlichkeitsverteilung. Das Histogramm einer binomialverteilten Zufallsgröße ist ein Säulendiagramm mit konkreten, isolierten, ganzzahligen Werten.
Die Normalverteilung ist eine stetige Wahrscheinlichkeitsverteilung. Eine normalverteilte Zufallsgröße wird durch eine Gauß’sche Glockenkurve abgebildet.
Konkrete Wahrscheinlichkeiten einer binomialverteilten Zufallsgröße können mit der oben gezeigten Formel von Bernoulli berechnet werden. Allerdings ist dies bei sehr großen Werten für n selbst mit einem Taschenrechner nicht mehr möglich.
In solchen Fällen dient die Normalverteilung als Näherung, die allerdings in der Regel nicht mit einer Formel berechnet wird. Die Werte der Wahrscheinlichkeiten können stattdessen in einem Tafelwerk bzw. einer Tabelle nachgeschlagen werden.
Das ist dann möglich, wenn die entsprechende Normalverteilung vorher standardisiert wurde.
Um eine Normalverteilung zu standardisieren, muss die vorliegende Zufallsgröße in eine neue Zufallsgröße z überführt werden – das nennt man z‑Transformation. Diese Umformung wird so vorgenommen, dass der Erwartungswert μ der standardisierten Normalverteilung der Zufallsgröße z genau beim Wert z=0 liegt und die Varianz genau σ2=1 beträgt.
Die Gauß’sche Glockenkurve einer solchen Standardnormalverteilung ist also symmetrisch um die y‑Achse positioniert, wie in der folgenden Abbildung dargestellt:
Jede Normalverteilung, beispielsweise auch die Verteilung der Körpergrößen, lässt sich in eine solche Standardnormalverteilung überführen, indem die Zufallsgröße bzw. Zufallsvariable transformiert wird.
Auf der y‑Achse sind die Wahrscheinlichkeiten P(X=r) abgetragen, also die Wahrscheinlichkeiten dafür, dass die normalverteilte, stetige Zufallsgröße X einen Wert r annimmt. Die möglichen Werte für r sind auf der x‑Achse aufgetragen.
Die Glockenkurve selbst wird durch die Verteilungsfunktion der Wahrscheinlichkeitsdichteϕ(z) beschrieben. Diese Funktion wird auch Dichtefunktion der Normalverteilung genannt. Die (rot markierte) Fläche unter der Glockenkurve wird durch die Funktion Φ(z) wiedergegeben, die wir gleich näher beschreiben.
Normalverteilung – Formel
Haben wir eine Standardnormalverteilung mit einer Glockenkurve abgebildet, die durch die Dichtefunktion ϕ(z) beschrieben wird, können wir eine Wahrscheinlichkeit P(X≤r) dafür berechnen, dass die Zufallsgröße X einen Wert kleiner oder gleichr annimmt. Dazu nutzen wir folgende Formel:
P(X≤r)=Φ(z)=−∞∫zϕ(z)dzmitz=σr−μ
Die kumulierte WahrscheinlichkeitP(X≤r)=Φ(z) entspricht dem Flächeninhalt der Fläche unter der Glockenkurve bis zum Wert r. Den Wert r, dessen (kumulierte) Wahrscheinlichkeit uns interessiert, rechnen wir in einen transformierten Wert z um, um mit der Standardnormalverteilung arbeiten zu können. Dazu nutzen wir folgende Formel:
z=σr−μ
Der Erwartungswert μ der Normalverteilung gibt an, für welchen Wert r die Normalverteilung ihr Maximum annimmt. In der standardisierten Form liegt dieses Maximum immer bei z=0, denn z=σr−μ ergibt genau für r=μ den Wert 0.
Der griechische Buchstabe σ bezeichnet die Standardabweichung, also die Wurzel der Varianz σ2. Die Standardabweichung ist ein Maß für die Breite der Wahrscheinlichkeitserteilung.
Schlaue Idee
Wenn du in einer Umfrage herausfinden möchtest, welche Musikrichtung bei deinen Mitschülerinnen und Mitschülern am beliebtesten ist, hilft dir die Normalverteilung, die Wahrscheinlichkeiten und Abweichungen zu verstehen.
Durch die Standardisierung der Normalverteilung gilt bei der entsprechenden Standardnormalverteilung immer σ2=1 und damit auch σ=1.
Die Integralfunktion Φ(z) der Dichtefunktion ϕ(z) heißt Gauß’sche Integralfunktion.
Bei einer stetigen, normalverteilten Zufallsgröße X gilt P(X≤r)=Φ(z) für jede reelle Zahlr. Das ist der Satz der Normalverteilung bei stetigen Zufallsgrößen.
Die genaue Form der Dichtefunktion ϕ(z) folgt folgender Formel:
ϕ(z)=σ2π1⋅e−21z2
bzw.
ϕ(r)=σ2π1⋅e−21(σr−μ)2
Diese Funktionsterme zeigen schon, dass die Berechnung der Normalverteilung nicht ganz einfach ist, da die Dichtefunktion ϕ(z) ja integriert werden muss. Deshalb wird in der Regel ein Tafelwerk bzw. eine Tabelle genutzt, in der die entsprechenden Wahrscheinlichkeiten der Standardnormalverteilung aufgelistet sind.
In dieser sogenannten Standardnormalverteilungstabelle sind allerdings nur Wahrscheinlichkeiten Φ(z) für positive Werte von z aufgelistet. Für negative Werte (−z) muss folgende Formel angewendet werden:
Φ(−z)=1−Φ(z)
Diese Formel ist gültig, weil die Standardnormalverteilung achsensymmetrisch um den Wert z=0 ist.
Normalverteilung – Anwendung
Mit der Normalverteilung können immer nur Wahrscheinlichkeiten von Intervallenbis zu einem Wert r angegeben werden, also kumulierte Wahrscheinlichkeiten, wie du sie vielleicht auch schon von der Binomialverteilung kennst.
Die kumulierte Wahrscheinlichkeit eines solchen Intervalls entspricht der Fläche unter der Gauß’schen Glockenkurve in dem entsprechenden Intervall.
Bei einem einzelnen, diskreten Wert r wäre die Fläche unter der Glockenkurve immer gleich null, da es keine Breite gäbe. Deshalb können konkrete Wahrscheinlichkeiten einzelner Ergebnisse einer normalverteilten Zufallsgröße nicht berechnet werden.
Schauen wir uns an einem konkreten Beispiel an, wie mit kumulierten Wahrscheinlichkeiten einer normalverteilten Zufallsgröße sinnvoll gerechnet wird.
Normalverteilung – Beispiel
Wir betrachten erneut das Beispiel der Körpergröße, die wir als annähernd normalverteilte Variable betrachten können. Sie ist annähernd normalverteilt, weil nur Größen innerhalb eines bestimmten Intervalls erwartbar sind. Die Normalverteilung läuft für Werte, die stark vom Erwartungswert abweichen, zwar gegen null, wird aber nicht null. Wäre die Körpergröße de facto normalverteilt, wären mit einer sehr geringen Wahrscheinlichkeit auch Körpergrößen von beispielsweise 10cm oder 10m möglich. Das ist biologisch allerdings ausgeschlossen.
Trotzdem lässt sich die Körpergröße näherungsweise sehr gut durch eine Normalverteilung beschreiben.
Nehmen wir an, die achtjährige Anne möchte wissen, mit welcher Wahrscheinlichkeit sie nicht größer als ihre ältere Schwester wird, die 170cm groß ist. Wir suchen also nach der Wahrscheinlichkeit P(X≤170cm). Die Körpergröße von Frauen folgt in Deutschland etwa einer Normalverteilung mit dem Erwartungswert von μ=165cm und einer Standardabweichung von σ=10cm.
Zur Berechnung der gesuchten Wahrscheinlichkeit nutzen wir den Satz der Normalverteilung bei stetigen Zufallsgrößen. Dazu müssen wir die Normalverteilung standardisieren, wir rechnen also zunächst r in z um. So erhalten wir:
z=σr−μ=10cm170cm−165cm=0,5
Du siehst, dass hier auch die Einheit cm wegfällt. Den errechneten Wert können wir nun in die Formel der Gauß’schen Integralfunktion Φ(z) einsetzen:
P(X≤165cm)=Φ(0,5)=−∞∫0,5ϕ(z)dz
Den Wert für Φ(0,5) der Standardnormalverteilung können wir nicht berechnen, aber aus der Standardnormalverteilungstabelle ablesen. So erhalten wir:
Φ(0,5)=0,69146
Anna wird also mit einer Wahrscheinlichkeit von rund 69% maximal 170cm groß.
Normalverteilung – Aufgaben
Probier' gerne einmal selbst, eine weitere, ähnliche Aufgabe zu lösen. Wenn du die richtige Lösung gefunden hast, kannst du auch die zweite und dritte Übungsaufgabe versuchen. Nutze dazu auch die Gegenwahrscheinlichkeiten bestimmter Ereignisse!
Es handelt sich um eine stetige Wahrscheinlichkeitsverteilung, da alle denkbaren Temperaturwerte angenommen werden können – zumindest zwischen gewissen natürlichen Unter- und Obergrenzen, die wir allerdings in unserer Näherung vernachlässigen.
Wir nehmen also an, dass die Verteilung der Durschnittstemperaturen näherungsweise normalverteilt ist.
Wir haben den Erwartungswertμ=18,4∘C und die Varianz2,27 gegeben – aus letzterer können wir die Standardabweichungσ berechnen, indem wir die Wurzel ziehen:
σ=2,27≈1,5∘C
Anmerkung: Die Standardabweichung muss die Einheit ∘C des Erwartungswertes haben. Für die Varianz war keine Einheit angegeben, weil Grad Celsius zum Quadrat keine sinnvolle Angabe ist.
Gesucht ist die kumulierte WahrscheinlichkeitP(X≤16∘C) von Temperaturen bis maximal 16∘C, das heißt bis zu einem Wert r=16∘C. Damit können wir die Normalverteilung standardisieren, indem wir z berechnen:
z=σr−μ=1,5∘C16∘C−18,4∘C=−1,6
Nun können wir die Formel für P(X≤16∘C) aufstellen:
P(X≤16∘C)=Φ(−1,6)=−∞∫−1,6ϕ(z)dz
Da wir hier einen negativen Wert von z haben, wenden wir außerdem folgende Formel an:
Φ(−z)=1−Φ(z) Φ(−1,6)=1−Φ(1,6)=1−−∞∫1,6ϕ(z)dz
Den Funktionswert Φ(1,6) können wir in der Standardnormalverteilungstabelle ablesen. Er beträgt:
Φ(1,6)=0,9452
Damit erhalten wir:
Φ(−1,6)=1−Φ(1,6)=1−0,9452=0,0548
Die Wahrscheinlichkeit für eine Durchschnittstemperatur von höchstens 16∘C im Juli in Deutschland beträgt also rund 5,5%.
Sehen wir uns die tatsächlichen Durchschnittstemperaturen der Jahre 2000 bis 2020 im Juli an, stellen wir fest, dass in der Tat nur in einem einzigen dieser 21 Jahre die entsprechende Temperatur unter 16∘C lag – nämlich im Jahr 2000 bei 15,3∘C. Die Annahme einer Normalverteilung war also eine sinnvolle Näherung.
Wie in der vorherigen Aufgabe haben wir es mit einer stetigen Wahrscheinlichkeitsverteilung zu tun, von der wir annehmen, dass es sich näherungsweise um eine Normalverteilung handelt.
Den Erwartungswertμ=18,4∘C und die Standardabweichungσ=1,5∘C haben wir oben bereits bestimmt.
Gesucht ist die kumulierte WahrscheinlichkeitP(X>20∘C) von Temperaturen größer als 20∘C, das heißt ab einem Wert r=20∘C.
Mit der Standardnormalverteilungstabelle können wir allerdings nur Wahrscheinlichkeiten P(X≤r) bestimmen, die kleiner gleich einem bestimmten Schwellenwert r sind.
Wir müssen also die Gegenwahrscheinlichkeit von P(X>20∘C) betrachten:
P(X>r)=1−P(X≤r) P(X>20∘C)=1−P(X≤20∘C)
Jetzt können wir wieder r in z umrechnen und den zu P(X≤r) gehörigen Funktionswert Φ(z) der Standardnormalverteilung bestimmen:
Die Wahrscheinlichkeit für eine Durchschnittstemperatur über 20∘C im Juli in Deutschland beträgt also rund 14%.
In der Tat lag bei 3 von 21 Jahren die tatsächliche Durchschnittstemperatur im Juli über 20∘C – nämlich in den Jahren 2006(22,0∘C), 2010(20,3∘C) und 2018(20,3∘C). Das entspricht ziemlich genau einem Anteil von einem Siebtel und damit rund 14%. Die Annahme einer Normalverteilung war also auch in diesem Fall eine sinnvolle Näherung.
Die Wahrscheinlichkeitsverteilung der mittleren Durchschnittstemperatur ist weiterhin stetig und näherungsweise normalverteilt.
Wir kennen bereits den Erwartungswertμ=18,4∘C und die Standardabweichungσ=1,5∘C.
Gesucht sind nun zwei kumulierte Wahrscheinlichkeiten, denn die Temperatur könnte sowohl um 1,5∘Cnach unten abweichen als auch nach oben.
Die kumulierte Wahrscheinlichkeit dafür, eine Temperatur um 1,5∘Cniedriger als die mittlere Durchschnittstemperatur zu erwischen – die beim Erwartungswert μ=18,4∘C liegt – können wir so formulieren:
P(X<18,4∘C−1,5∘C)=P(X<16,9∘C)≈P(X≤16,9∘C)
Näherungsweise ist es unerheblich, ob wir den diskreten Temperaturwert 1,5∘C noch in die kumulierte Wahrscheinlichkeit miteinbeziehen oder nicht, da der einzelne Wert in der stetigen Wahrscheinlichkeitsverteilung verschwindend klein ist. Die kumulierte Wahrscheinlichkeit P(X≤1,5∘C) können wir wieder mithilfe der Standardnormalverteilungstabelle ermitteln.
Die kumulierte Wahrscheinlichkeit dafür, eine Temperatur um 1,5∘Cüber dem Erwartungswert μ=18,4∘C zu erwischen, können wir mithilfe der Gegenwahrscheinlichkeit formulieren:
P(X>18,4∘C+1,5∘C)=P(X>19,9∘C)=1−P(X≤19,9∘C)
Die beiden kumulierten Wahrscheinlichkeiten P(X≤16,9∘C) und P(X≤19,9∘C) können wir bestimmen, wenn wir jeweils z berechnen (und im Anschluss in die Gauß’sche Integralfunktion einsetzen):
z1=σr1−μ=1,5∘C16,9∘C−18,4∘C=−1
z2=σr2−μ=1,5∘C19,9∘C−18,4∘C=1
In beiden Fällen erhalten wir einen Betrag von 1, weil die gesuchte Temperaturabweichung genau der Standardabweichung σ entspricht und weil die Standardnormalverteilung symmetrisch um den Erwartungswert ist. Es ist also ausreichend, Φ(1) zu ermitteln (und diese Wahrscheinlichkeit später mal zwei zu nehmen), denn es gilt:
Hier sehen wir noch einmal, dass P(X<16,9∘C) und P(X>19,9∘C) gleich groß sind. Beide kumulierten Wahrscheinlichkeiten entsprechen jeweils der Gegenwahrscheinlichkeit des Funktionswertes Φ(1), den wir in der Standardnormalverteilungstabelle nachsehen können:
Die Wahrscheinlichkeit dafür, dass die Durchschnittstemperatur im Juli um mindestens 1,5∘C von der mittleren Durchschnittstemperatur abweicht, ist die Summe der beiden berechneten kumulierten Wahrscheinlichkeiten. Sie beträgt also rund 32%.
Diese Überlegung ist in Bezug auf die mittlere Durchschnittstemperatur übrigens auch dann noch gültig, wenn sich der Erwartungswert μ im Laufe zukünftiger Jahre zu höheren Temperaturen verschiebt – was er aufgrund des Klimawandels tatsächlich auch tut.
Denn die Form der Gauß’schen Glockenkurve verändert sich nicht (sie wird nur im Ganzen weiter nach rechts verschoben). Die Standardnormalverteilung bleibt selbst davon unberührt, da sie immer in Bezug auf den jeweils gültigen Erwartungswert standardisiert wird.
Normalverteilung – Bedeutung der Standardabweichung
In unserer letzten Beispielaufgabe haben wir die kumulierten Wahrscheinlichkeiten von Abweichungen betrachtet, die genau den Bereichen der Glockenkurve jenseits der Standardabweichung entsprechen.
Fehleralarm
Es wird oft angenommen, dass bei der Normalverteilung genau die Hälfte der Werte größer und die Hälfte kleiner als der Mittelwert sind. In Wirklichkeit ist der Mittelwert der Wert, um den die Werte am dichtesten gruppiert sind.
Da die Standardabweichung der Standardnormalverteilung (nach rechts) immer dem Wert z=1 entspricht und damit den Bereich der Wahrscheinlichkeiten von Φ(−1) bis Φ(1) unter der Glockenkurve einschließt, gilt für jede normalverteilte Zufallsgröße:
P(−σ≤X≤σ)=−σ∫σϕ(z)dz≈68%
Der Bereich der kumulierten Wahrscheinlichkeit, die genau außerhalb der Standardabweichung liegt (also die Gegenwahrscheinlichkeit darstellt), beträgt also bei einer normalverteilten Zufallsgröße immer rund 32%.
Aus der geschickten Betrachtung von Gegenwahrscheinlichkeiten wird auch ersichtlich, wie Wahrscheinlichkeiten von Intervallen mit beliebigen Grenzen a und b berechnet werden können:
Ist a<μ, wird za<0 sein. Dann muss wieder die Formel Φ(−z)=1−Φ(z) angewendet werden.
Ausblick - das lernst du nach Normalverteilung bei stetigen Zufallsgrößen
Bist du bereit, dich weiter mit Statistik auseinanderzusetzen? Hypothesentests und die unterschiedliche Wahl von Signifikanzniveaus sind spannende Themen, die auf dein Wissen über Normalverteilung aufbauen.
Zusammenfassung der Normalverteilung
Die Normalverteilung ist eine stetige Wahrscheinlichkeitsverteilung. Viele statistisch gestreute Merkmale, Ereignisse und Abläufe sind näherungsweise normalverteilt und können demnach durch die Normalverteilung abgebildet werden.
Der Satz der Normalverteilung bei stetigen Zufallsgrößen besagt, dass die Wahrscheinlichkeitsverteilung einer stetigen, normalverteilten Zufallsgröße X der Gauß’schen IntegralfunktionΦ(z) folgt. Das heißt, für jedes reelle r gilt: P(X≤r)=Φ(z)=−∞∫zϕ(z)dzmitz=σr−μ
Die Dichtefunktionϕ(z) beschreibt die Gauß’sche Glockenkurve.
Mit der Integralfunktion Φ(z) kann die Fläche eines Intervalls unter der Glockenkurve bestimmt werden. Diese Fläche entspricht der kumulierten Wahrscheinlichkeit der Ergebnisse in den Grenzen des Intervalls.
Im Unterschied zur Binomialverteilung ist die Normalverteilung nicht diskret, sondern stetig. Das heißt einerseits, dass die Zufallsgröße X nicht nur bestimmte, sondern alle möglichen (reellen) Werte r annehmen kann, andererseits können mit der Normalverteilung keine Wahrscheinlichkeiten einzelner, konkreter Ereignisse berechnet werden, sondern nur die kumulierten Wahrscheinlichkeiten entsprechender Intervalle.
Für sehr große n kann eine binomialverteilte Zufallsgröße näherungsweise als normalverteilt angesehen werden.
Um Wahrscheinlichkeiten mithilfe der Normalverteilung zu bestimmen, muss in der Regel eine z‑Transformation zur Standardnormalverteilung vorgenommen werden. Dazu müssen der Erwartungswert μ und die Standardabweichung σ der (näherungsweise) normalverteilten Zufallsgröße bekannt sein. Es gilt: z=σr−μ
Ein gesuchter Funktionswert Φ(z) kann dann in der Standardnormalverteilungstabelle nachgeschlagen werden.
Für negativez gilt: Φ(−z)=1−Φ(z)
Standardnormalverteilungstabelle
Hier kannst du dir die Standardnormalverteilungstabelle anzeigen lassen.
Für die Werte von z, die in der linken Spalte aufgelistet sind, werden jeweils zehn Werte der Gauß’schen Integralfunktion Φ(z) (jeweils in der zugehörigen Zeile) aufgeführt. Diese zehn Werte gehören jeweils zu den z‑Werten mit entsprechender Nachkommastelle.
So gehört beispielsweise in der 0,3er‑Zeile der Φ(z)‑Wert 0,64058 zum z‑Wert 0,36.
Für negative z‑Werte ist die Formel Φ(−z)=1−Φ(z) zu beachten.
Die Normalverteilung ist eine Wahrscheinlichkeitsverteilung, mit der die Wahrscheinlichkeiten P(X≤r) aller reellen Ergebnisse r einer stetigen, normalverteilten Zufallsgröße X bestimmt werden können. Diese Wahrscheinlichkeiten werden über die Gauß’sche IntegralfunktionΦ(z) bestimmt. Es gilt: P(X≤r)=Φ(z)=−∞∫zϕ(z)dzmitz=σr−μ
Die Wahrscheinlichkeitsverteilung einer normalverteilten Zufallsgröße folgt der Gauß’schen Glockenkurve mit der Dichtefunktion ϕ(z).
Die Normalverteilung kann bei vielen verschiedenen statistisch gestreuten Merkmalen, Ereignissen und Abläufen angewendet werden, denn viele Prozesse sind näherungsweise normalverteilt.
Eine Funktion einer Zufallsgröße X ist dann normalverteilt, wenn die Wahrscheinlichkeitsverteilung der Zufallsgröße der Form einer Gauß’schen Glockenkurve folgt.
Das ist bei sehr vielen stetigen Zufallsgrößen der Fall, sofern die Stichprobe bzw. die Anzahl der Zufallsversuche n hinreichend groß ist.
Beispiele wären die Verteilung der Körpergrößen von Menschen, Tieren oder Pflanzen auf der Welt oder die Verteilung der Temperaturen in einer Region.
Sehr viele Zufallsgrößen lassen sich näherungsweise als normalverteilt betrachten.
Für die Transformation einer binomialverteilten Zufallsgröße in die Normalverteilung gilt, dass die Standardabweichungσ mindestens einen Wert von 3 haben sollte.
Die Binomialverteilung wird für diskrete Zufallsgrößen angewandt, wenn es nur die Ergebnisse Treffer (Erfolg) und Nichtreffer (Misserfolg) gibt und die Anzahl der (voneinander unabhängigen) Zufallsversuche bzw. Wiederholungen n klein genug ist, sodass die Formel von Bernoulli numerisch mit dem Taschenrechner lösbar ist.
Die Normalverteilung wird bei einer stetigen Wahrscheinlichkeitsverteilung angewandt, vor allem als Näherung für sehr große Stichproben bzw. Anzahlen von Zufallsversuchen.
Für sehr große n geht die Binomialverteilung näherungsweise in die Normalverteilung über – ein solcher Übergang ist auch für andere Arten von Wahrscheinlichkeitsverteilungen zu beobachten. So sind in der Realität sehr viel Zufallsgrößen näherungsweise normalverteilt.
Sehr viele stetige Zufallsgrößen sind näherungsweise normalverteilt – das sind Zufallsgrößen, die nahezu jeden beliebigen, reellen Wert r annehmen können.
Oft sind solche Zufallsgrößen in der Realität zwar auf eine bestimmte Spanne von Werten beschränkt – zum Beispiel die möglichen Körpergrößen von Menschen oder Temperaturen auf der Erde – aber innerhalb dieser Spanne kann eine praktisch unendliche Anzahl verschiedener Werte auftreten, zum Beispiel Körpergrößen oder Temperaturen, die sich erst in der zehnten Stelle hinter dem Komma unterscheiden. Viele weitere Arten von Messwerten treten in der Realität näherungsweise normalverteilt auf.
Die Gauß’sche Glockenkurve der Normalverteilung wird mit der Dichtefunktionϕ(z) berechnet und die Gauß’sche IntegralfunktionΦ(z) gibt die kumulierte Wahrscheinlichkeit wieder, die der Fläche unter der Glockenkurve bis zu einem bestimmten Wert r einer normalverteilten Zufallsgröße X entspricht. Es gilt: P(X≤r)=Φ(z)=−∞∫zϕ(z)dzmitz=σr−μ
Allerdings ist die Lösung eines solchen Integrals nicht einfach zu berechnen. Deshalb ist es in der Regel notwendig, die Normalverteilung zu standardisieren.
Dazu müssen zunächst die Werte r der Zufallsgröße mit der Formel z=σr−μ in entsprechende z‑Werte umgerechnet werden.
Dann können die zugehörigen Funktionswerte Φ(z) der Standardnormalverteilung in einem Tafelwerk – der Standardnormalverteilungstabelle – nachgeschlagen werden.
In der Normalverteilungstabelle, genauer gesagt der Standardnormalverteilungstabelle sind die Werte der Integralfunktion Φ(z) üblicherweise in Zeilen und Spalten geordnet und werden Zeile für Zeile von links nach rechts gelesen. Der vorderste Wert in einer Zeile gehört dann immer zu einem Wert z mit nur einer Nachkommastelle.
So gehört der erste Wert ganz links zu z=0,0, der Wert darunter zu z=0,1 und wiederum der Wert darunter zu z=0,2 usw.
Die zusätzlichen Werte in den Zeilen, die in den weiteren Spalten rechts neben den jeweils ersten Werten folgen, gehören dann zu den entsprechenden z‑Werten mit einer zweiten Nachkommastelle, welche wiederum von 1 bis 9 durchläuft.
So gehört der zweite Werte in der ersten Zeile zu z=0,11, der dritte Wert zu z=0,12, der vierte Wert zu z=0,13 usw.
In der nächsten Zeile folgen dann entsprechend die Werte für z=0,2, z=0,21, z=0,22, z=0,23 usw. von links nach rechts.
Beachte außerdem, dass ein Funktionswert Φ(z) immer die kumulierte Wahrscheinlichkeit des Intervalls von −∞ bis z wiedergibt. Konkrete Wahrscheinlichkeiten einzelner Ergebnisse können nicht bestimmt werden.
Für negativez‑Werte ist außerdem folgende Formel zu beachten:
Φ(−z)=1−Φ(z)
Es ist nicht möglich, ein Φ(−z) direkt aus der Standardnormalverteilungstabelle abzulesen.
Ja, eine Normalverteilung bildet immer die Wahrscheinlichkeitsverteilung einer stetigen Zufallsgröße ab. Die Dichtefunktion (und damit die Gauß’sche Glockenkurve) ist über einen kontinuierlichen Bereich definiert, es gibt keine Sprünge oder Unterbrechungen.
Es ist allerdings möglich, eine diskrete Zufallsgröße näherungsweise durch eine Normalverteilung abzubilden. Dabei wird die diskrete Zufallsgröße streng genommen in eine neue, stetige Zufallsgröße transformiert.
Die Normalverteilung stellt also oft eine Näherung dar, bei der so getan wird, als ob eine diskrete Zufallsgröße stetig wäre.
Eine Zufallsgröße ist streng genommen nicht normalverteilt, wenn sie nur bestimmte, diskrete Werte annimmt. Wenn die Wahrscheinlichkeitsverteilung der Zufallsgröße außerdem nicht einmal annähernd der Gauß’schen Glockenkurve folgt, kann sie auch nicht näherungsweise durch die Normalverteilung abgebildet werden.
Das ist beispielsweise dann der Fall, wenn die Streuung – und damit die Standardabweichung – deutlich zu groß oder zu gering ist oder wenn es signifikante Ausreißer gibt, wenn die Verteilung stark asymmetrisch (oder schief) ist oder der Umfang der Stichprobe zu klein ist, um eine Näherung über viele verschiedene Werte der Zufallsgröße vorzunehmen.
Der Erwartungswert einer Normalverteilung entspricht dem Wert von r, bei dem das Maximum der Gauß’schen Glockenkurve (der Wahrscheinlichkeitsdichte) liegt.
Bei einer Standardnormalverteilung liegt der Erwartungswert E(X) immer bei z=0.
Bei einer binomialverteilten Zufallsgröße mit hinreichend großer Anzahl an Wiederholungen n kann näherungsweise eine Normalverteilung angenommen werden. In diesem Fall kann der Erwartungswert μ mit der Formel für den Erwartungswert einer Binomialverteilung berechnet werden. Es gilt dann also: E(X)=μ=n⋅p
Hier ist p die Trefferwahrscheinlichkeit bei einem Versuch bzw. einer Wiederholung.
Um zu entscheiden, ob eine binomialverteilte Zufallsgröße mit einer Normalverteilung angenähert werden kann, muss der Erwartungswert μ bekannt sein (bzw. berechnet werden) und es sollten zwei weitere Größen betrachtet werden: die Anzahl der Versuche/Wiederholungen n und die Standardabweichung σ.
Ist n hinreichend groß, kann die Normalverteilung angenommen werden. Um damit Wahrscheinlichkeiten zu berechnen, muss neben dem Erwartungswert μ allerdings auch die Standardabweichung σ berechnet werden (oder bekannt sein), um die entsprechende Normalverteilung standardisieren zu können.
In der Regel wird die Einschränkung vorgenommen, dass nur bei einer Standardabweichung mit einem Wert von mindestens 3 die Annahme einer Normalverteilung sinnvoll ist. Bei sehr großem n ist diese Bedingung in der Regel schnell erfüllt, denn es gilt: σ=n⋅p⋅(1−p)
Die Trefferwahrscheinlichkeitp liegt immer zwischen 0 und 1.
Für n=50 Münzwürfe mit p=0,5 ist diese Bedingung beispielsweise bereits erfüllt, denn: σ=50⋅0,5⋅(1−0,5)≈3,5
Weil wir Ihr sofatutor-Erlebnis verbessern möchten, ...
... nutzen wir eigene und Drittanbieter-Cookies, sowie ähnliche Technologien. Notwendige Cookies gewährleisten die sichere Nutzung unserer Plattform, andere helfen uns, das Angebot zu verbessern und zu analysieren. Es wird zwischen "Notwendige Cookies", "Funktionalität & Komfort", "Statistik & Analyse" und "Marketing" unterschieden. Weitere Details finden Sie in der Datenschutzerklärung und den Cookie-Details.
Indem Sie “Einverstanden” klicken, stimmen Sie der Nutzung aller Cookies zu. Falls Sie auf “Nicht einverstanden” klicken, werden nur notwendige Cookies gesetzt. Unter “Cookies einstellen” finden Sie weitere Details zu Zwecken und Drittanbietern und können individuelle Präferenzen festlegen. Ihre Einwilligung umfasst dann auch Datenübermittlungen in Länder ohne mit der EU vergleichbares Datenschutzniveau. Sie können Ihre Auswahl jederzeit ändern oder widerrufen.
Bist du unter 16 Jahre alt? Dann klicke bitte „Alles ablehnen“ oder hole die Erlaubnis deiner Erziehungsberechtigten ein.
Wir können unseren Service für Sie u.a. weiter optimieren und Inhalte auf Sie zuschneiden, sodass Sie relevante Produkte und Inhalte entdecken.
Sie müssen damit leben, dass unsere Inhalte nicht auf Sie zugeschnitten sind und Sie eventuell relevante Produkte und Angebote verpassen.