PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Stochastik


darph
2010-04-03, 19:13:49
Folgende Aufgabe:

Multiple-Choice-Test mit n Fragen.
Jede Frage hat genau 4 Antworten, von denen jeweils genau 1 korrekt ist. Alle Fragen müssen beantwortet werden.
Der Test ist bestanden, wenn 40% aller Fragen korrekt beantwortet wurden.

Wie viele Fragen muß man stellen, damit man durch Raten eine Chance zu Bestehen von 0,05 oder kleiner hat.


Mein Ansatz:

Anzahl Versuche: n = ?
Erfolgswahrscheinlichkeit für einen Versuch: k = 1/4 = 0,25
Anzahl Versuche für's Bestehen: p = n * 0,4

Die Wahrscheinlichkeit, den Test durch Raten zu bestehen ist ja dann die Binomialverteilung

Also B(k | n,p) = (n choose k) * (p^n) * (1 - p)^(n-k) = 0,05

(n choose n * 0.4) * (0.25^(n*0.4)) * (0.75^(n-(n*0.4))) = 0.05

oder

Binomial[n, n 0.4] 0.25^(n 0.4) 0.75^(n - n 0.4) == 0.05




Da es sich um eine Binomialverteilung handelt, ist der Ewartungswert E(X) = die Summe über k=0 bis n von B(k | n,p), oder kurz n * p.

Ergo: E(X) = n * p = n/4 = n * 0,25

und die Varianz Var(X) = p * p^2 = p*(1-p) = 0,25 * 0,75 = 0,1875
Daraus folgt die Standardabweichung σ = √Var(x) ≈ 0,433



Tschebyschow-Ungleichung:

P({|X - E(X)| ≥ ε}) ≤ Var(x) / ε^2)= 0,05

Also 0,1875 / ε^2 = 0,05

dann ist ε ≈ 1,93649

Und dann steigt's bei mir aus. Was soll mir das helfen? Oder wo ist da mein Denkfehler?

Plutos
2010-04-03, 22:46:56
8 :smile: (0,4/0,05) würd' ich sagen :smile:.

darph
2010-04-03, 22:53:59
Das wäre 0,1807.

Oberon
2010-04-04, 11:35:31
Du bringst was durcheinander, p ist die Trefferwahrscheinlichkeit und k ist die Anzahl der Treffer.

Ich würde sagen das ist eine komische Aufgabe.
Die Verteilungsfunktion der Binomialverteilung lässt sich ja angeben (siehe Wiki).
Diese gibt an, wie hoch die Wahrscheinlichkeit ist, dass die Anzahl der Treffer unter einem bestimmten Wert ist.
In unserem Fall ist also p gegeben, und wir wissen, dass wir n so bestimmen müssen, dass die Wskt für 0.4*n Treffer oder weniger (eigentlich nur weniger) größer als 0.95 sein muss.

Das setzt man jetzt in die Summenformel ein und man hat einen widerlichen Ausdruck der sich mMn nach nicht analytisch lösen lässt (nur numerisch/ausprobieren).
Ich lasse mich da aber auch gerne korrigieren, falls jemand einen Lösungsweg sieht.

darph
2010-04-04, 12:18:25
Ich würde sagen das ist eine komische Aufgabe.
Aus einer Klausur.

Es soll (!) mit der Tschebyschow-Ungleichung approximiert werden.

Alkopol
2010-04-04, 13:21:39
Du kannst die Binominalverteilung durch die Normalverteilung approximieren, wenn gilt: n>9/(pi*(1-pi)
Ich lasse n einfach mal 50 sein (dann ist es anschaulicher):
E(x)=n*pi=50*0,25=12,5
Var(X)=n*pi*(1-pi)=9,375

Bedingung:
0,05=P(X>=c) = 1-(P<c) = 1-P(X<=c-1)
0,95=P(X<=c-1) = Phi(c-1+0,5-12,5/Wurzel aus 9,375) (die +0,5 wegen der Approximation durch die Normalverteilung; Formel ist in der Formelsammlung zu finden)
0,95=Phi(c-13/Wurzel(9,375))
1,645=c-13/Wurzel(9,375)
C=18

pest
2010-04-04, 14:41:25
und die Varianz Var(X) = p * p^2 = p*(1-p) = 0,25 * 0,75 = 0,1875


Var[X]=n*p*q

es kommt ~23 raus

darph
2010-04-04, 15:18:37
Var[X]=n*p*q

es kommt ~23 raus
Warum und wie? ;(

pest
2010-04-04, 15:27:47
rechte Seite der Tschebycheff-Ungl.

P(|X-E[X]| >= 0.4*n) <= (n*p*q)/(0.4*n)²=0.05

n=p*q/(0.4²*0.05)=(0.25*0.75)/(0.16*0.05)=23.43

darph
2010-04-04, 15:40:55
Args. bernoulli-Verteilung und Binomialverteilung. X-(
lalala

Oberon
2010-04-04, 18:19:11
Bin ich jetzt blöd oder müsste das nicht heißen:
P(|X-E[X]| >= 0.15*n) <= (n*p*q)/(0.15*n)²=0.05 :confused:
Der Erw.wert ist doch 0.25*n, und erzielt werden müssen 0.4*n, die Differenz wäre 0.15*n.

pest
2010-04-04, 18:42:59
Bin ich jetzt blöd oder müsste das nicht heißen:
P(|X-E[X]| >= 0.15*n) <= (n*p*q)/(0.15*n)²=0.05 :confused:
Der Erw.wert ist doch 0.25*n, und erzielt werden müssen 0.4*n, die Differenz wäre 0.15*n.

P(X>=x) gibt im Bernoulli-Versuch die Wkt. an, das mindestens x Treffer erfolgt sind, und wir wollen 40% Treffer, also x=0.4*n

Oberon
2010-04-04, 22:11:48
Ja natürlich, aber E[X] ist doch nicht 0, sondern 0.25*n.
Wenn X größer 0.4*n sein soll, dann muss X-E[X] größer als 0.15*n sein.

pest
2010-04-05, 10:06:31
ich weiß was du meinst, ich habe ja eigentlich die Streuung um E[X] betrachtet.
Hm, mit 0.15n für k kommt aber totaler Müll raus (~166 Versuche)

Oberon
2010-04-06, 13:24:16
Hm...wer weiß, das könnte ja auch die Lösung sein. Will mal schnell einer nachrechnen? X-(

pest
2010-04-06, 18:14:43
Das ist nicht schwör

n=23
P[X<=23*0.4] = 0.959221

d.h. die Wkt. den Test zu bestehen ist 0.04077
(für n=22 ist die 0.074, wie zu erwarten)

für alle größeren n nimmt die Wkt natürlich ab, für n=166 ist sie nahe Null.

Oberon
2010-04-06, 19:48:55
Komisch, das verwirrt mich gerade echt. Was ich hier problematisch finde, ist, dass die T.-Ungl. eine symmetrische Abweichung um µ betrachtet, uns geht es aber hier um eine asymmetrische (nur nach oben).
Äh und trotzdem scheint nach deiner Rechnung das richtige rauszukommen, wenn du 0.4n einsetzt.

----->:uconf2:

€: und mein MATLAB sagt schon wieder was ganz anderes. Zefixfunction [n] = find_n
n=5;
y=0;
while y<0.95
bereich=0:n;
y=binopdf(bereich,n,0.25);
y=sum(y(1:0.4*n));
n=n+1;
end

end

pest
2010-04-09, 16:41:32
was sagt denn dein matlab-programm?

mein prof meinte die bestehens-bedingung "40% richtig beantwoten zum bestehen" lässt sich nicht in die symmetrische formulierung der t-ung. packen.

ich hatte also glück :)

Oberon
2010-04-09, 20:39:56
Das Matlab spuckt irgendwas um die 33 oder so aus :confused:
Gut den Code hab ich nur auf die Schnelle hingeschludert, aber der sollte eigentlich schon stimmen.

pest
2010-04-09, 21:05:21
hat das Ding keine CDF-Funktion (also kumulativ)

hier Mathematica
http://www.abload.de/img/binmathe9he.png

kann es auch noch mal manuell machen

Oberon
2010-04-09, 21:28:19
Kann es.

http://666kb.com/i/bi806za9154pmx9bu.gif


34 war die Zahl die die Funktion find_n ausgespuckt hatte.

pest
2010-04-09, 21:44:36
also hatte ich "recht" ... weil n>23 funktionieren sowieso, kannst ja nochmal 22 probieren

ot: bei dem slicing operator bekomm ich irgendwie immer die krise