Thema: Stochastik

Direkt zum Thema zu springen:


Drei Bereiche

Die Stochastik ist in drei Bereiche eingeteilt, die hintereinander unterrichtet werden:

1. Beschreibende Statistik: Daten darstellen und auswerten

2. Wahrscheinlichkeitsrechnung: Mit dem Zufall rechnen

3. Beurteilende Statistik: Daten beurteilen


Wiederholungen: Begriffe

Zufallsexperiment

Ein Experiment ist ein Zufallsexperiment, wenn es die drei Bedingungen erfüllt:

- Es gibt verschiedene Ergebnisse.

- Die Ergebnisse sind vorher bekannt.

- Der Ausgang ist zufällig.



Laplace-Experiment

Ein Laplace-Experiment ist ein Zufallsexperiment, bei dem alle Ergebnisse die gleiche Wahrscheinlichkeit haben.



Ergebnis, Ergebnismenge, Wahrscheinlichkeit

Beispiel: Aus einer Urne mit drei grünen und zwei orangenen Kugeln werden blind zwei gezogen.

Ein mögliches Ergebnis lautet: Orange Grün

Alle möglichen Ergebnisse werden in der Ergebnismenge zusammengefasst:
{Grün Grün; Grün Orange; Orange Grün; Orange Orange}

Die Wahrscheinlichkeit (engl. probability) notiert man mit einem großen P:
P(Grün Grün) = 25 %
Sie kann in Prozent, als Bruch oder als Dezimalzahl angegeben werden.



Aufgaben: S. 218 / 1 bis 4


Baumdiagramme

folgt



Anmerkung: Baumdiagramme können sowohl horizontal als auch vertikal gezeichnet werden.



Aufgaben: S. 218 / 5, 6, 7


Vierfeldertafeln

folgt



Aufgaben: S. 227 / 16, 17, 18


Vokabeln

Beispiel: Umfrage zur Dauer des Schulweges



Weitere Vokabeln und Formeln


Stichprobenumfang ∑
∑ = H(x1) + H(x2) + ... + H(x5)
(Summe aller absoluten Häufigkeiten)


Relative Häufigkeit h(x)
h(x1) = \(\frac{\text{H}(\text{x}_1)}{\Sigma}\)
(Häufigkeiten in Relation zur Gesamtanzahl)


Arithmetisches Mittel (Mittelwert) x:
Aus H(x): x = \(\frac{\text{H}(\text{x}_1)\cdot(\text{x}_1) + \text{H}(\text{x}_2)\cdot(\text{x}_2) + ... + \text{H}(\text{x}_5)\cdot(\text{x}_5)}{\Sigma}\)
Aus h(x): x = h(x1)∙x1 + h(x2)∙x2 + ... + h(x5)∙x5


Spannweite
"größter Wert" - "kleinster Wert"
(Die Spannweite vom größten zum kleinsten Wert)


Standardabweichung s oder σ
s oder σ = \(\sqrt{h(x_1)\cdot(x_1 - \overline{x})^2 + ... + h(x_5)\cdot(x_5 - \overline{x})^2}\)
(Wie sehr die Daten um den Mittelwert streuen)


Wahrscheinlichkeitsverteilung

Die Wahrscheinlichkeitsverteilung ist eine Zuordnung von Ergebnissen x eines Zufallsexperiments zu Wahrscheinlichkeiten P(X=x).

Die Wahrscheinlichkeitsverteilung kann in einem Histogramm dargestellt werden. Der Flächeninhalt der Säulen entspricht dabei jeweils der Wahrscheinlichkeit des zugehörigen Ergebnisses.



Aufgaben: S. 244 / 1 sowie S. 245 / 3, 8, 6
(teilweise abgewandelt)


Erwartungswert

Der Erwartungswert E(X) oder µ „mü“ einer Zufallsgröße X mit den Ausprägungen x1, x2, … , xn ist:

Er ist quasi das "arithmetische Mittel" von zufälligen Ergebnissen.



Aufgaben: S. 249 / 1 und 2


Standardabweichung und Varianz

Die Standardabweichung σ(X) ist ein Maß für die Streuung von Datenpunkten um den Erwartungswert E(X). Eine kleine Standardabweichung bedeutet, dass die Daten eng um den Mittelwert gruppiert sind, während eine große Standardabweichung auf eine starke Streuung der Daten hinweist.

Die Standardabweichung ist die Wurzel aus der Varianz Var(X). Die Standardabweichung gibt die Information in denselben Einheiten wie die ursprünglichen Daten an.



Aufgaben: S. 251 / 7, 9, 10


E(X) und σ(X) mit dem GTR

[STAT] -> "edit" -> Verteilung in Listen eintragen

[STAT] -> CALC -> "1-Var Stats"

L2 als "FreqList" eingeben -> Calculate

x entspricht E(X) und σX entspricht σ(X)


Übungen bis hierhin

Fundament-Aufgaben: S. 258 / 1 bis 8


Anzahl Möglichkeiten

Bei Berechnungen von Kombinationsmöglichkeiten und Wahrscheinlichkeiten gibt es zwei mathematische Hilfen:

"n Fakultät": n! = n∙(n-1)∙(n-2)∙...∙2∙1

"n über k": \( \begin{pmatrix} \textcolor{var(--orange)}{\text{n}}\\\textcolor{var(--gruen)}{\text{k}} \end{pmatrix} \) = \(\frac{\textcolor{var(--orange)}{\text{n}}\text{!}}{\textcolor{var(--gruen)}{\text{k}}\text{!}\cdot(\textcolor{var(--orange)}{\text{n}}-\textcolor{var(--gruen)}{\text{k}})!}\) (auch "Binomialkoeffizient" genannt)


Wenn aus n Elementen k Elemente ausgewählt werden, gibt es \( \begin{pmatrix} \textcolor{var(--orange)}{\text{n}}\\\textcolor{var(--gruen)}{\text{k}} \end{pmatrix} \) Möglichkeiten.



Beispiel

Aus einer Urne mit fünf verschiedenfarbigen Kugeln werden zufällig drei Kugeln gezogen.

Dabei gibt es folgende Anzahl an Möglichkeiten, welche Farben gezogen werden können:

In der Wahrscheinlichkeitsrechnung wird meistens der dritte Fall "ohne Zurücklegen und ohne bestimmte Reihenfolge" betrachtet.



Aufgaben: S. 265 / 1, 2, 3


Bernoulli-Exp. und -Kette

Bernoulli-Experiment: Ein Zufallsexperiment mit nur 2 möglichen Ergebnissen: „Erfolg“ und „Misserfolg“.

Wahrscheinlichkeiten:
P(„Erfolg“) = p
P(„Misserfolg“) = q = (1 – p) = (100% - p)

Wird ein Bernoulli-Experiment n-mal durchgeführt und ändert sich die Wahrscheinlichkeit dabei nicht, so entsteht eine Bernoulli-Kette der Länge n.



Aufgaben: S. 269 / 1, 2, 3 und 5


Binomialverteilung

Bei einer Bernoulli-Kette der Länge n mit einer Trefferwahrscheinlichkeit p kann die Wahrscheinlichkeit genau k Treffer zu erhalten wie folgt berechnet werden:

P(X = k) = \( \begin{pmatrix} \textcolor{var(--orange)}{\text{n}}\\\textcolor{var(--gruen)}{\text{k}} \end{pmatrix} \) ∙ pk ∙ (1 – p)nk

Die dazugehörige Wahrscheinlichkeitsverteilung für alle k heißt Binomialverteilung Bn,p(k). Damit werden in kurzer Schreibweise alle Informationen (Wahrscheinlichkeit und Länge) der Verteilung festgehalten.



Mit dem GTR

[DISTR] "Das ist sind die Verteilungen"

"A:binompdf(" "Die einfache Binomialverteilung"

trials: n
p: p
x value: k



Aufgaben: S. 271 / 6


Kumulierte Wahrscheinlichkeiten

Kumulieren bedeutet "anhäufen". Bei kumulierten Wahrscheinlichkeiten werden die Wahrscheinlichkeiten aller Ergebnisse bis zu einem vorgegebenen Ergebnis addiert ("angehäuft").



Beispiel

Eine Münze wird zwölfmal geworfen. Es wird bei jedem Wurf geguckt, ob „Zahl“ oben liegt. Die Zufallsgröße X gibt die Anzahl „Zahlen“ an.

Da es sich um eine Bernoulli-Kette der Länge 12 handelt, kann die Binomialverteilung verwendet werden. Im Diagramm sind die Wahrscheinlichkeiten der jeweiligen Ergebnisse dargestellt:

Bei kumulierten Wahrscheinlichkeiten (GTR-Befehl "B:binomcdf(") wird bei jedem Ergebnis die Summe der vorherigen Wahrscheinlichkeiten angegeben. Im Diagramm addieren sich also jeweils die Werte immer weiter:

Das bedeutet z.B., dass die Wahrscheinlichkeit, höchstens 6-mal "Zahl" zu werfen, bei ca. 61 % liegt.
P(X ≤ 6) = 0,61



Mit dem GTR

[DISTR] "Das ist sind die Verteilungen"

"B:binomcdf(" "Die kumulierte Binomialverteilung"

trials: n
p: p
x value: k



Aufgaben: S. 271 / 9, 7 sowie S. 277 / 8


E(X) und s(X) bei Binomialverteilungen

Der Erwartungswert μ einer binomialverteilten Zufallsgröße X ist:

Die Standardabweichung σ einer binomialverteilten Zufallsgröße X ist:



Beispiel:

Ein 6-seitiger Würfel wird zwölfmal geworfen. Es wird bei jedem Wurf geguckt, ob eine 6 gewürfelt wird. Die Zufallsgröße X gibt die Anzahl Sechsen an.

a) Handelt es sich um eine binomialverteilte Zufallsgröße? Begründe.

b) Wie groß sind n und p?

c) Welche Anzahl an Sechsen ist am ehesten zu erwarten?



Lösungen:

a) Ja, da es nur "Erfolg" und "Misserfolg" gibt und sich deren Wahrscheinlichkeiten nicht verändern.

b) n = 12, p = 1/6

c) 2



Aufgaben: S. 283 / 1, 2 und 3


Sigma-Regeln

Bei einer binomialverteilten Zufallsgröße X gibt es um den Erwartungswert μ sogenannte Sigma-Umgebungen, wenn die Laplace-Bedingung σ > 3 erfüllt ist. Sie beinhalten dann immer circa gleich große Anteile aller Ergebnisse.

Hier dargestellt sind die Sigma-Umgebungen einer binomialverteilten Zufallsgröße mit n = 60 und p = 1/3. Der Erwartungswert ist dann μ = 20 und die Standardabweichung ist σ = 3,65.



Vorgehen

- Erwartungswert μ und Standardabweichung σ bestimmen.

- Standardabweichung für 1σ so lassen, für 2σ verdoppeln oder 3σ verdreifachen.

- Dies für die linke Grenze vom Erwartungswert subtrahieren und für die rechte Grenze addieren.

- Grenze als Intervall angeben: ["linke Grenze"; "rechte Grenze"]



Beispiel:

Der Erwartungswert sei μ = 45 und die Standardabweichung σ = 3

Die 1σ-Umgebung [42; 48] beinhaltet ca. 68% aller Ergebnisse.

Die 2σ-Umgebung [39; 51] beinhaltet ca. 95,5% aller Ergebnisse.

Die 3σ-Umgebung [36; 54] beinhaltet ca. 99,7% aller Ergebnisse.



Aufgaben: S. 286 / 9 (1), 10


Prognosen

Prognosen funktionieren prinzipiell genauso wie die Sigma-Regeln und ihre Sigma-Umgebungen. Hier wird jedoch nicht betrachtet, welcher Anteil aller Ergebnisse in festgelegten Umgebungen ist (1σ, 2σ und 3σ), sondern umgekehrt welche Umgebungen einen festgelegten Anteil aller Ergebnisse enthalten (90%, 95% und 99%).

Bei einer binomialverteilten Zufallsgröße X gibt es um den Erwartungswert μ sogenannte Prognose-Intervalle, wenn die Laplace-Bedingung σ > 3 erfüllt ist. Sie beinhalten dann immer circa gleich große Anteile aller Ergebnisse.

Hier dargestellt sind die Prognose-Intervalle einer binomialverteilten Zufallsgröße mit n = 60 und p = 1/3. Der Erwartungswert ist dann μ = 20 und die Standardabweichung ist σ = 3,65.

Ergebnisse, die außerhalb des 95%-Intervalls liegen, weichen signifikant vom Erwartungswert ab.

Ergebnisse, die sogar außerhalb des 99%-Intervalls liegen, weichen hochsignifikant vom Erwartungswert ab.



Vorgehen

- Erwartungswert μ und Standardabweichung σ bestimmen.

- Standardabweichung σ mit 1,64 multiplizieren, um das 90%-Intervall anzugeben, mit 1,96 für das 95%-Intervall multiplizieren oder mit 2,58 für das 99%-Intervall multiplizieren.

- Dies für die linke Grenze vom Erwartungswert subtrahieren und für die rechte Grenze addieren.

- Grenze als Intervall angeben: ["linke Grenze"; "rechte Grenze"]



Beispiel:

Der Erwartungswert sei μ = 45 und die Standardabweichung σ = 3

Das 90%-Intervall lautet [40,08; 49,92].

Das 90%-Intervall lautet [39,12; 50,88].

Das 90%-Intervall lautet [37,26; 52,74].



Aufgaben: S. 294 / Bsp. 1 sowie 294 / 2 und 296 / 8


Stochastisch unabhängig

Zwei Ergebnisse A und B sind stochastisch unabhängig, wenn ihre Wahrscheinlichkeiten nicht voneinander beeinflusst werden. Dann gilt:

Die linken Angaben bedeuten "Die Wahrscheinlichkeit von B, nachdem A bereits eingetroffen ist" bzw. "Die Wahrscheinlichkeit von A, nachdem B bereits eingetroffen ist".

Im Baumdiagramm vergleicht man dafür folgendes:



Oder: Zwei Ergebnisse A und B sind stochastisch unabhängig, wenn die Wahrscheinlichkeit, dass beide zutreffen, gleich dem Produkt der einzelnen Wahrscheinlichkeiten ist. Dann gilt:

In einer Vierfeldertafel vergleicht man dafür folgendes:



Aufgaben: S. 236 und 237