Beregning af statistisk styrke

Spørgsmål:

Beregning af statistisk styrke

Adhesh Josh

2012-01-17 19:43:45 UTC

view on stackexchange narkive permalink

Som jeg forstår det, er jeg nødt til at kende mindst tre aspekter (ud af fire) af min foreslåede undersøgelse for at udføre effektanalyse, nemlig:

type test - jeg har til hensigt at bruge Pearson's r og ANCOVA / Regression - GLM
signifikansniveau (alfa) - Jeg har til hensigt at bruge 0,05
forventet effektstørrelse - Jeg har til hensigt at bruge en medium effektstørrelse (0,5)
stikprøvestørrelse

Kan nogen anbefale en god online strømberegner, som jeg kan bruge til at foretage a priori effektberegning. (Kan SPSS foretage a priori effektberegning?)

Jeg er stødt på GPower, men jeg leder efter et enklere værktøj!

Desværre inkluderer SPSS-pakken ikke et modul til strømanalyse. IBM SPSS-selskab sælger et separat program til strømanalyse.

Jeg giver GPower en chance. Med 20 eller 30 minutter at udforske det, vil du sandsynligvis finde det meget håndterbart - i det mindste for procedurer som korrelation, ikke nødvendigvis for en kompliceret regressionsmodel.

Tak! Er der en brugervenlig guide tilgængelig på GPower?

Dette ser ud som om det er tilskudsansøgning. Disse er irriterende at producere og evaluere. For velbrugte eksperimentelle designs (genom-dækkende associeringsundersøgelser for eksempel) kan der være veldokumenterede specialiserede regnemaskiner. Ellers tror jeg G. Jay Kerns svar er den rigtige vej at gå med følgende tilføjelse: mens du er ved det, skal du simulere en række af de vigtigste parametre og præsentere en graf.

En svar:

user1108

2012-01-17 21:04:47 UTC

view on stackexchange narkive permalink

Dette er ikke et svar, du vil ønske at høre, jeg er bange, men jeg vil alligevel sige det: prøv at modstå fristelsen ved online regnemaskiner (og spar dine penge, før du køber proprietære regnemaskiner).

Her er nogle af grundene til: 1) online-regnemaskiner bruger alle forskellige notationer og er ofte dårligt dokumenterede. Det er spild af din tid. 2) SPSS tilbyder en strømberegner, men jeg har aldrig prøvet det, fordi det var for dyrt for min afdeling at have råd til det! 3) Sætninger som "medium effektstørrelse" er i bedste fald vildledende og i værste fald simpelthen forkert for alle undtagen de enkleste forskningsdesign. Der er for mange parametre og for meget samspil til at være i stand til at destillere effektstørrelse ned til et enkelt tal i [0,1]. Selvom du kunne sætte det i et enkelt nummer, er der ingen garanti for, at Cohens 0,5 svarer til "medium" i forbindelse med problemet.

Tro mig - det er bedre i det lange løb at bide i kuglen og lær dig selv, hvordan du bruger simulering til din fordel (og til gavn for den eller de personer, du konsulterer). Sæt dig ned med dem, og udfør følgende trin:

1) Beslut en model, der er passende i forbindelse med problemet (lyder som om du allerede har arbejdet på denne del).

2) Konsulter dem for at bestemme, hvad nullparametrene skal være, kontrolgruppens opførsel, uanset hvad dette betyder i forbindelse med problemet.

3) Konsulter dem for at bestemme, hvad parametrene skal være for at forskellen skal være praktisk meningsfuld . Hvis der er begrænsninger på stikprøver, skal dette også identificeres her.

4) Simuler data i henhold til de to modeller i 2) og 3), og kør din test. Du kan gøre dette med masser af software - vælg din favorit og gå efter den. Se om du har afvist eller ej.

5) Gentag 4) tusinder af gange, sig $ n $. Hold styr på, hvor mange gange du afviste, og prøveandelen $ \ hat {p} $ af afvisninger er et skøn over effekt. Dette skøn har en standardfejl på ca. $ \ sqrt {\ hat {p} (1 - \ hat {p}) / n} $.

Hvis du foretager din strømanalyse på denne måde, vil du finde flere ting: A) der løb meget flere parametre, end du nogensinde havde forventet. Det får dig til at undre dig over, hvordan det i verden er muligt at kollapse dem alle til et enkelt nummer som "medium" - og du vil se, at det ikke er muligt, i det mindste ikke på nogen ligetil måde. B) din magt bliver meget mindre end mange andre lommeregnere reklamerer for. C) du kan øge effekten ved at øge prøvestørrelsen, men pas på! Du kan måske finde ud af, at for at opdage en forskel, der er "praktisk meningsfuld", har du brug for en prøvestørrelse, der er uoverkommelig stor.

Hvis du har problemer med et af ovenstående trin, kan du samle dine tanker, formuler godt et spørgsmål til CrossValidated, og folkene her vil hjælpe dig.

REDIGER: I tilfælde af at du finder ud af, at du absolut skal bruge en online lommeregner, den bedste jeg vi har fundet er Russ Lenths side med magt og prøvestørrelse. Det har eksisteret i lang tid, det har relativt komplet dokumentation, det afhænger ikke af størrelser på dåseeffekt og har links til andre papirer, der er relevante og vigtige.

EN ANDEN EDIT: Tilfældigt, da dette spørgsmål kom op, var jeg lige midt i at skrive et blogindlæg for at uddybe nogle af disse ideer (ellers ville jeg muligvis ikke have svaret så hurtigt). I hvert fald afsluttede jeg det sidste weekend, og du kan finde det her. Det er ikke skrevet med SPSS i tankerne, men jeg vil vædde på, at hvis en person var klog, kunne de muligvis oversætte dele af det til SPSS-syntaks.

+1 Godt svar. Det er værd at påpege ulemperne ved simulering. (Alternativet er, at effektkurver kan beregnes matematisk.) Simulation bliver uhåndterlig, når mange parametre (såsom effektstørrelse og prøvestørrelse) skal manipuleres, eller når du søger en tærskelværdi, f.eks. En minimumsstørrelse. Selv et * omtrentligt * nøjagtigt udtryk for magten kan være værdifuldt til generelt at indikere, hvordan magten opfører sig, og til at identificere indledende løsninger, der kan poleres med en smule simulering.

@whuber Tak, og du har helt ret. Din kommentar minder mig om, at der ofte er ekstra usikkerhed i null / alt-parametrene (ringe info, skrøbelige pilotundersøgelser osv.), Som tilføjer endnu et lag af kompleksitet til simuleringsmetoden. Dette er en anden fordel ved den matematiske tilgang.

I stedet for at fastsætte værdierne for de ukendte parametre er det nyttigt at simulere dem ved at tildele en tidligere distribution på disse parametre og derefter få en "prior power" (dette er ikke en Bayesisk tilgang på trods af begrebet tidligere distribution, fordi vi simulerer resultatet af hyppighedstesten)

Der er to problemer med simulering: At lære det (denne er opløselig) og få trin 3 færdig. Efter min erfaring ville ingen af mine klienter være villige til at gøre 3). Mange har problemer med at specificere ALLE effekter. At bede dem om at specificere parametrene i (siger) en multipel regressionsligning ville være ... godt, de ville ikke vide, hvordan de skulle svare, selvom de kender betydningen, vil de ikke være villige til at specificere.

Stephane ja, du har ret, og det var det, jeg mente med det ekstra lag, jeg prøvede at kommunikere. @Peter * Sukk! * Ja, jeg har også stødt på dette. Jeg prøver at tale om midler, standardfejl osv. Og træne så meget af matematikken, som jeg kan bagefter. En del af det er en kommunikationsbarriere, som nogle gange er en udfordring. Uvilje-delen er dog endnu hårdere. Det plejede at være, at jeg selv ville give op og forsøge at udfylde emnerne, men det fungerede sjældent godt. Det vil sige, svaret er i det væsentlige et skud i mørket med en bind for øjnene og står bagud.

Tak, alle sammen. Diskussionen giver ikke meget mening for mig endnu (jeg får det til sidst med nogle baggrundsundersøgelser hentet med pegepinde i disse indlæg!), Så min bekymring er, at jeg med tillid vil sige, at jeg har designet en undersøgelse med tilstrækkelig kraft, og hvis effekten er ikke til stede, så er det usandsynligt, at den findes i befolkningen.

@PeterFlom Medmindre deres forskning er helt ny, kan du snyde lidt og hente oplysningerne fra litteraturen fra lignende studier. Eller en, jeg har brugt "Hvilken effekt ville gøre dig begejstret og ivrig efter at offentliggøre?"

Ting er lidt lettere, når penge er involveret, og når man udfører operationelle piloter, hvor omkostningerne ved interventioner er kendte (og fremtidige omkostninger er forudsigelige med en vis fejl). Nogle gange kan cost-benefit-analyser arbejde i vores favør. :)

ⓘ

Denne spørgsmål og svar blev automatisk oversat fra det engelske sprog.Det originale indhold er tilgængeligt på stackexchange, som vi takker for den cc by-sa 3.0-licens, den distribueres under.

Loading...