Kolmogorow-Smirnow

Mitglied seit
19.03.2002
Beiträge
2.539
Reaktionen
11
Ich habe 2 Mengen von Zeiten. Die Mengen ergeben sich aus
Versuch 1 zu:
3,50
3,90
2,80
4,00
3,30
und aus Versuch 2 zu:
7,00
6,00
5,20
4,90
5,20

Ich muss nun wissen, ob die beiden Versuche statistisch signifikant Unterschiedliche Zeiten liefern. Das tun sie, wie man sieht, aber ich brauche natürlich einen Beweis. Ich krieg das nur nicht berechnet, weil mir die Wiki und alle anderne Beispiele nicht klar werdne wollen. Kann sich wer erbarmen und das mal für die je 5 Werte durchrechnen und zwar komplett?

http://www.youtube.com/watch?v=9Of2LTy5Sq0 <-- da hängt es bei mir beim kritischen Wert. Der müsste imho bei 5% Fehlerwarscheinlichkeit und der je 5 Daten hier laut Tabelle bei [SIZE=-1]0,563 liegen, oder se ich das ganz falsch?
[/SIZE]
 
Mitglied seit
19.03.2002
Beiträge
2.539
Reaktionen
11
Wegen des ausfürlichen Rechenwegs?

Ich brauch einmal ein Zahlenbeispiel durchgerechnet.
 
Mitglied seit
03.08.2002
Beiträge
702
Reaktionen
0
Mitglied seit
15.09.2000
Beiträge
1.408
Reaktionen
261
Du willst Verteilungen auf Signifikanz testen mit 5 Beobachtungen? Da graust es mir ja. Der zweiseitige KS ist nur asymptotisch. Die Formel, die der da benutzt, 1.63 / sqrt(n) gilt nur fuer grosse n. Und nein, 5 ist nicht gross.

Also vergiss es einfach. Organisier Dir entweder noch 20 weitere Datenpunkte (was eigentlich immer noch zu wenig ist), oder teste auf gleichen Mittelwert (was eigentlich auch nicht so wirklich in Ordnung ist).
 
Mitglied seit
19.03.2002
Beiträge
2.539
Reaktionen
11
Ich werde 8 bis 10 Datensätze haben und zwar in 2 Mengen. Mehr ist nicht. Nun muss ich zeigen, dass die beiden Mengen statistisch unabhängig sind. KS-Test springt mir da entgegen und auf der gelinkten Seite kann ich das mit je 10 Daten auch machen. Ich hab aber keine Ahnung wie der Rechenweg aussieht für so Datensätze. Wäre shcön wenn mir jemand das zeigen könnte.
Wenn es anderen Test gibt für eine solche Datenzahl und mir jemand den erklärt nehm ich ihn auch, aber mehr Daten ist keine Option.
 
Mitglied seit
31.03.2001
Beiträge
26.862
Reaktionen
501
also eigentlich würd ich auch sagen, dass der KS der richtig ist...der ist doch recht robust und kann eben auch bei kleinem n angewendet werden, soweit ich mich entsinne...klar braucht man dann nen stärkeren Effekt für Signifikanz, aber anwenden darf er den da imho
 
Mitglied seit
19.03.2002
Beiträge
2.539
Reaktionen
11
Meine Zahlen sind halt auch extrem. Aber ich finde kein durchgerechnetes Beispiel. Kann das nicht irgendwer mal mahen bitte?
 
Mitglied seit
15.09.2000
Beiträge
1.408
Reaktionen
261
da gibt es nicht viel zu rechnen

die Verteilungsfunktion von Menge 1 ist bei 4 bei 1, die andere faengt erst bei 4.9 an.

Also ist sup ( F_1 - F_2 ) = 1.

Jetzt brauchen wir den krit Wert. Fuer kleine Sample-Sizes schauen wir in die Tabelle: http://www.soest.hawaii.edu/wessel/courses/gg313/Critical_KS.pdf und sehen bei 5/5: "You cannot reject regardless of sample size".

Naja, wenn Du noch nen Punkt kriegst und sich die Mengen weiterhin ausschliessen, kannst dann in der Tat rejecten.

Edit: ich sehe gerade:
Nun muss ich zeigen, dass die beiden Mengen statistisch unabhängig sind.
Irgendwie hab ich den Satz ueberlesen. "Statistisch unabhängig". Da graust es mir ja alles. Schau Dir nochmal die Nullhypothese vom KS an.
 
Zuletzt bearbeitet:
Mitglied seit
04.08.2010
Beiträge
84
Reaktionen
0
Ich hab einmal versucht deinen ersten datensatz auf normalverteilung (weils einfach leichter ist) zu überprüfen. Sollte im prinzip ja das sein was du möchtest nur das du statt normalverteilung auf eine andere verteilung testen möchtest. Ich habe aber bisher hauptsächlich mit chi-quadrat gearbeitet. KS ist für mich neuland, bitte übernehm daher meine schritte nicht blind. Ich habe aus reinem interesse bzw der weiterbildung wegen :) versucht mich durch das verfahren zu arbeiten und die wichtigsten schritte möglichst leicht und ohne programmierung etc zu lösen. Das ganze schien am ende doch relativ leicht zu sein, daher bin ich skeptisch was mein ergebniss an geht.

Meine annahme war follgende: Die werte sind um den erwartungswert 3,5 mit einer standartabweichung von 0,2 normalverteilt.



Uploaded with ImageShack.us
 
Mitglied seit
19.03.2002
Beiträge
2.539
Reaktionen
11
Danke erstmal für die Mühe, aber genau das möchte ich eigentlich nicht.
Ich möchte zeigen, dass sich die beiden Mengen deutlich unterscheiden.
The Kolmogorov–Smirnov test may also be used to test whether two underlying one-dimensional probability distributions differ. In this case, the Kolmogorov–Smirnov statistic is
948584776a78e7218aba9475e6bddbea.png
where F1,n and F2,n' are the empirical distribution functions of the first and the second sample respectively.
The null hypothesis is rejected at level α if
5e5677c131dbcd672be8a758d0712585.png
Note that the two-sample test checks whether the two data samples come from the same distribution. This does not specify what that common distribution is (e.g. normal or not normal).


Ich habe aber keine Ahnung von Statistik und finde kein Rechenbeispiel.


TealC in der Tabelle sind aber bei 6 Samples bereits Ergebnisse möglich. Die Zahlen hier sind nur Beispiele damit ich einmal 'ne Rechnung sehen kann. Stell dir halt noch eine Zahl jeder Menge doppelt vor von mir aus. Ich will einfach verstehen wie ich vorgehen muss.
 
Mitglied seit
19.03.2002
Beiträge
2.539
Reaktionen
11
Wie gesgat mein problem ist ich habe Zeiten zu zwei Arbeitswegen und ich will einfach wissen ob man statistisch belegen kann in irgend einer Form, dass Weg 2 besser ist.
 
Mitglied seit
15.09.2000
Beiträge
1.408
Reaktionen
261
Was ist denn das Problem?

Stell F_1 und F_2 auf und rechne den sup. Fuer Verteilungsfunktionen siehe http://de.wikipedia.org/wiki/Verteilungsfunktion

Wie ich oben geschrieben habe, ergibt das sup(F_1 - F_2) = 1, da sich die Mengen ausschliessen.

Dann liest den Wert aus der Tabelle und guckst ob Deiner groesser ist. Also angenommen, Du haettest 6 Werte in jeder Reihe und die Teststatistik bleibt 1, dann muss das groesser sein, als der kritische Wert. Gemaess meiner Tabelle ist das der Fall, also kannst die Nullhypothese "gleiche Verteilung" verwerfen.

Die Formel, die Du da fuer den kritischen Wert benutzt, gilt nur fuer grosse n. Deshalb ist es besser in der Tabelle zu schauen.
 
Mitglied seit
19.03.2002
Beiträge
2.539
Reaktionen
11
Das ist wirklich shcon alles? Ich darf das so machen?
 
Mitglied seit
15.09.2000
Beiträge
1.408
Reaktionen
261
Ja, ich denke schon. Ich lag oben falsch. Ich sah auf Wiki nur die asymptotische Verteilung der Teststatistik und hatte das auch falsch in Erinnerung, da ich dachte es ginge nicht fuer small sample sizes.

Allerdings wuerd ich den kritischen Wert in irgendeinem Lehrbuch nachlesen und daraus zitieren. Mit Ausnahme von dem von mir verlinkten, finde ich auf Anhieb im Netz nur die asymptotischen kritischen Werten. Und das von mir verlinkte ist ja nur ein pdf ohne jegliche Erklaerung.

Ansonsten musst noch mit der Formulierung Deiner Nullhypothese aufpassen und Dir im klaren sein, was der Test aussagt. Dann passt das schon :hammer:
 
Mitglied seit
19.03.2002
Beiträge
2.539
Reaktionen
11
Danke.
Werd es einfach nehmen, da sich die Zaheln wirklich extrem abheben. Hab hier als kleinsten Unterschied Faktor 3. Wen sich das nicht ändert, wovon nicht auszugehen ist sollte das dann passen.

Bin ich eigentlich der einzige der das bis zum Abitur nie hatte?
 

FORYOUITERRA

TROLL
Mitglied seit
22.07.2002
Beiträge
4.796
Reaktionen
430
Website
www.frauentag.de
Du willst Verteilungen auf Signifikanz testen mit 5 Beobachtungen? Da graust es mir ja. Der zweiseitige KS ist nur asymptotisch. Die Formel, die der da benutzt, 1.63 / sqrt(n) gilt nur fuer grosse n. Und nein, 5 ist nicht gross.

Also vergiss es einfach. Organisier Dir entweder noch 20 weitere Datenpunkte (was eigentlich immer noch zu wenig ist), oder teste auf gleichen Mittelwert (was eigentlich auch nicht so wirklich in Ordnung ist).

und wenn du dir 20000 weitere datenpunkte organisierst, dann kannst du auch direkt ne normalverteilung annehmen! die welt ist so einfach. und da das für große stichproben asymptotisch gilt, kann er approximativ auch die normalverteilung für sehr kleine stichproben annehmen. die welt ist eben so einfach.

schau mal in http://www.amazon.de/Nichtparametrische-statistische-Methoden-Gruyter-Lehrbücher/dp/3110163519.
das ist btw. das beste deutsprachige nichtparametrische buch, was du auf dem markt finden wirst.
 
Zuletzt bearbeitet:
Mitglied seit
15.09.2000
Beiträge
1.408
Reaktionen
261
Wofuer disst Du mich denn?

Ich dachte eben, dass KS nen asymptotischer Test ist. Habe ja schon zugegeben, dass ich mich geirrt habe.

Ich hatte das auch nie in der Schule. Ist das wirklich in manchen Laendern Abistoff?
 
Mitglied seit
19.03.2002
Beiträge
2.539
Reaktionen
11
Also bei uns gabs garkeine Statistik. Offiziell weiß ich durch die Schule nichtmal wie groß die Chance bei einem Münzwurf ist.
 

mfb

Mitglied seit
18.07.2003
Beiträge
791
Reaktionen
0
Website
diablo3.ingame.de
Wozu wollt ihr eigentlich die Verteilungen vergleichen?

und ich will einfach wissen ob man statistisch belegen kann in irgend einer Form, dass Weg 2 besser ist.

Ich würde Weg 2 als besser bezeichnen, wenn der Mittelwert sich signifikant unterscheidet. Nicht zwingend der Mittelwert des Zeitaufwands, aber der Mittelwert irgendeiner Funktion die "besser" geeignet quantifiziert. Die Varianz kann aus der Probe selbst geschätzt werden.

3,50|3,90|2,80|4,00|3,30
-> Mittelwert 3,... +- 0,...

7,00|6,00|5,20|4,90|5,20
-> Mittelwert 5,... +- 0,...

=> Differenz 2,... +- 0,..., passenden Test drüber (im Zweifelsfall: Normalverteilung annehmen und Standardabweichungen zählen)

Das dürfte für alle sinnvollen Anwendungszwecke reichen.
 
Oben