PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Lösung eines statistischen Problems. Welche Software?


Crossfade
2015-11-13, 12:29:52
Hallo,

ich steh gerade vor einem statistischen Problem, das ich ohne einer entsprechenden Software wohl nicht mehr lösen kann. Zumindest komme ich mit meinen Excel Kenntnissen hier an meine Grenzen, bzw. glaube ich dass Excel dazu auch nicht mehr in der Lage ist. Nun frage ich mich ob andere Statistiksoftware (im Optimalfall eine kostenlose, gibt's ja viele) dazu in der Lage ist. Evtl. kennt sich jemand von euch da aus und kann mir direkt etwas empfehlen, bevor es bei mir in einem großen Trial&Error ausartet.

Folgendes Problem:

Ich habe einen Datensatz von 63 verschiedenen Beträgen. Aus diesen Beträgen werden nun 41 zufällig ausgewählt, die Summe und der Mittelwert gebildet.

Was ich nun bräuchte ist der Mittelwert und die Standartabweichung aller Summen/Mittelwerte aller möglichen Kombinationen dieser 41 aus 63 Fällen.

Manuell, oder auch per Excel rechnen zu lassen ist bei lächerlichen 29.196.020.509.898 Möglichkeiten (ohne Beachtung der Reihenfolge natürlich) wohl keine Option mehr :freak:

Ist dies mit diverser Statistiksoftware machbar?

Danke schonmal für eure Antworten!

noid
2015-11-13, 12:41:28
Ich weiß jetzt zwar nicht ob man deine Fragestellung damit besser lösen kann, aber hier mal Statistik Software https://www.r-project.org/

Sumpfmolch
2015-11-13, 19:33:16
Hm ich würde das Problem erst mal auf übersichtliche Mengen herunterbrechen und schauen, ob sich da eine Gesetzmäßigkeit für das Ergebnis andeutet. Mittelwert und Summe aller Mittelwerte und Summen riecht irgendwie danach. Dann interessiert einen vielleicht eher ein mathematischer Beweis, denn eine Softwareberechnung...

Trap
2015-11-13, 19:48:28
Das einzig interessante ist die Standardabweichung der Summe, der Rest ist linear...

NiCoSt
2015-11-13, 19:50:35
Die Fragestellung klingt für mich sehr seltsam und eher nach einem nicht auf die zur Verfügung stehenden Statistik angepasstem Verfahren. Bei der Anwendung von statistik ist der oberste Leitsatz: passe nicht die Mathematik auf dein problem an, sondern arbeite daran, dein problem mit der Mathematik zu beschreiben, die du kannst/verstehst.

Anyway, ich nutze für die meisten Statistikfragen JMP.
Bei soeiner speziellen Fragestellung würde ich aber eher zu R raten, denn es klingt eher nach einer Scripthaften abarbeitung.

NiCoSt

Spasstiger
2015-11-13, 20:05:16
Alle Kombinationen sind imo mit einem PC nicht in menschlicher Lebenszeit berechenbar. :freak:

Mich würde aber nicht überraschen, wenn die Standardabweichung aus allen Kombinations-Summen über einen linearen Faktor mit der Standardabweichung aus allen 63 Einzelbeträgen zusammenhängt.

/EDIT: Ich habe eben mit Matlab gespielt. Bei 2 aus 4 beträgt der vermutete Faktor 0.9129 (Standardabweichung der Einzelbeträge zu Standardabweichung aller Kombinationssummen) unabhängig von den konkreten Werten der Einzelbeträge. Jetzt müsste man die Gesetzmäßigkeit finden, die den Faktor für jegliche Kombinatorik bestimmt.
Die Standardabweichung der Mittelwerte = std(Summe(1..i)/n) ist übrigens einfach 1/n*std(Summe(1..i)).
/EDIT2: Mag da nicht Jemand einen Beweis bzw. eine Herleitung führen? Mir scheint das recht einfach zu sein, ich bin nur schon zu lange aus der Materie raus. Ich denke, dass das Problem heute abend lösbar sein sollte, ohne alle Kombinationen tatsächlich berechnen zu müssen.

@Crossfade: Die Lösung deines Problems lautet f(41,63)*Standardabweichung(Einzelbeträge). Leider kann ich dir die Funktion f nicht nennen.

Sumpfmolch
2015-11-13, 21:09:33
Der Mittelwert über die Mittelwerte sämtlicher möglicher Ziehungen 41 aus 63 dürfte schlichtweg identisch sein zum Mittelwert der Zahlen selbst.