Statistikproblemchen

FORYOUITERRA

TROLL
Mitglied seit
22.07.2002
Beiträge
5.832
Reaktionen
629
vielleicht kennt sich jemand mit der problematik von multiplen tests besser aus als ich:

ich hab hier eine testproblem, welches eine teststatik postuliert, die für verschiedene "gruppen" unter H0 den wert 1 annehmen soll.

H0: T_{ij} = 1 für alle i,j aus den jeweiligen indexmengen.

ich kann jede teststatik ausrechnen und wie üblich mit den kritischen werten der korrespondierenden verteilung vergleichen.

problem ist: muß ich für die signifikanzniveaus eine bonferroni-korrektur machen, oder liegt hier kein problem des multiplen testens vor?:hammer:
 

FORYOUITERRA

TROLL
Mitglied seit
22.07.2002
Beiträge
5.832
Reaktionen
629
...und ich war schon kurz davor eine umfrage einzubauen und somit den publikumsjoker zu wählen.
ich kann ja auch nichts dafür. :(
 
Mitglied seit
03.08.2002
Beiträge
3.586
Reaktionen
0
Hm das Zeugs lerne ich gerade auch. Was schreibst du?
Übermorgen werde ich dir deine Frage hoffentlich beantworten können.^^
 
Mitglied seit
30.07.2000
Beiträge
4.606
Reaktionen
61
Beschreib doch einfach mal genau, wie der Test/die Testung aussehen soll, im wirklichen leben.
 

FORYOUITERRA

TROLL
Mitglied seit
22.07.2002
Beiträge
5.832
Reaktionen
629
ich verstehe nicht so recht, was euch die zusätzliche information bringen sollte. die tests sind allesamt innerhalb derselben studie.
und es geht einzig und alleine darum, ob man dieses "für alle i,j" simultan versteht, was dann unweigerlich in die problematik des multiplen testens führt - oder ob ich mir jeden test einzelnd anschauen kann und damit der problematik entgehe.

edit: für eine schriftliche arbeit, also keine klausur.
das von mir benutzte buch macht keine aussagen über irgendwelche korrekturen - aber ich bin mir fast sicher, daß diese nötig sind. ähnlich multipler t-tests.
 
Mitglied seit
30.07.2000
Beiträge
4.606
Reaktionen
61
Wenn du für jedes i,j einen Signifikanztest machst (also "multipel testest"), musst du natürlich korrigieren, wie du selber ja schon festgestellt hast. Wenn du nur einen Test à la i1j1 = i1j2 = i2j1 = i2j2 = 1 machst, natürlich nicht. Ich verstehe da nicht so ganz, wo die Frage ist, und um herauszufinden, welche Variante des Testens für deine Daten sinnvoll ist, hätte mich halt die Fragestellung interessiert. Gerade, wenn solche statistischen "Grundlagen" nicht sitzen, ist es oft sinnvoll, die ganze Vorgehensweise nochmal von einigen anderen Augen checken zu lassen.
 

FORYOUITERRA

TROLL
Mitglied seit
22.07.2002
Beiträge
5.832
Reaktionen
629
beispiel t-tests für c gruppen, du willst testen, ob die gruppen sich unterscheiden.:
du machst das ganze ja dann dann mittels paarweiser vergleiche. d.h. wenn T_{i} die teststatistik für zwei beliebige gruppen ist, dann hast du effektiv c(c-1)/2 paarweise vergleiche zu testen.
unter H0 dürfte: T_{1}= ... = T_{i} = ... = T_{c(c-1)/2} = 0 gelten.
mit anderen worten:
H0: T_{i}=0 für alle i

in meinem fall stehe ich vor einem ähnlichen problem: habe halt nicht nur einen laufindex nun, sondern für jede kombination von i,j eine separate teststatistik und jeder dieser statistiken hat dann einen zugehörigen p-wert. also eindeutig multiples testen.
wollte mich nur absichern, da ich weiß, daß das problem nicht damit zusammenhängt, daß man möglichst viele teststatistiken hat, sondern einzig von der zugrundeliegenden fragestellung abhängt.
- so schaut man bei der regressionsanalyse beim parameteroutput auch immer nur jeden einzelnen parameter für sich an und entgeht dem problem des multiplen testens damit.
 
Mitglied seit
19.09.2001
Beiträge
2.379
Reaktionen
17
hm...

also wenn du echt interesse hast an der ganzen sache, schreib mir ne pm und wir können miteinander telefonieren und uns austauschen, ich gelfe dir _sehr gerne_ nun dazu *sing ein kleines lied HEHE* rufe mich einfach an (vorher pm bitte). wir können telefonieren vorher und dann lässt sich immer weitergucken wie man klakommt. treffen nicht ausgeschlossen. hätte sogar lust darauf eine runde bw zu spielen mit dir. wie heisst du eigentlich?
 

FORYOUITERRA

TROLL
Mitglied seit
22.07.2002
Beiträge
5.832
Reaktionen
629
nachdem ihr mir das letzte mal so gut helfen konntet, noch ein problem:

mein glm output von R:

Null deviance: 716.19 on 611 degrees of freedom
Residual deviance: 631.01 on 576 degrees of freedom
AIC: 1806.9

wie kommt er auf das AIC?

ich hab insgesamt 612 freiheitsgrade im nullmodell und 36 im geschätzten modell.
müßte ich nicht "AIC= deviance +2 (612-576)" errechnen?
 

gosubert

Guest
das akaike kriterium ist doch:

AIC = ln(RSS/n)+ 2*(K+1)/n


mit:
RSS = Summe der Residuenqadrate
n = Anzahl der Beobachtungen
K = Anzahl der Steigungsparameter

oder ?
 

FORYOUITERRA

TROLL
Mitglied seit
22.07.2002
Beiträge
5.832
Reaktionen
629
dies ist ein glm gewesen - generalized linear model. sorry hab vergessen das dabei zu schreiben. ist eine poisson regression gewesen.
 

gosubert

Guest
also wird bei GLM nicht der logarithmus genommen ?!

aber doch trotzdem beim strafterm durch die Beobachtungsanzahl dividiert, oder ?
 
Oben