Skal kovariater, der ikke er statistisk signifikante, "holdes", når man opretter en model?

A.M.

2013-08-03 23:05:39 UTC

view on stackexchange narkive permalink

Jeg har flere kovariater i min beregning for en model, og ikke alle er statistisk signifikante. Skal jeg fjerne dem, der ikke er?

Dette spørgsmål diskuterer fænomenet, men svarer ikke på mit spørgsmål: Hvordan fortolkes ikke-signifikant effekt af et kovariat i ANCOVA?

Der er intet i svaret på det spørgsmål, der antyder, at ikke-signifikante kovariater tages ud, men så lige nu er jeg tilbøjelig til at tro, at de skal blive i. Før jeg selv læste det svar, tænkte jeg det samme, da et kovariat stadig kan forklare noget af variansen (og dermed hjælpe modellen) uden nødvendigvis at forklare et beløb ud over en eller anden tærskel (signifikansgrænsen, som jeg ser som ikke anvendelig for kovariater).

Der er et andet spørgsmål et eller andet sted på CV, som svaret synes at antyde, at kovariater skal holdes inde uanset betydning, men det er ikke klart på det. (Jeg vil linke til dette spørgsmål, men jeg kunne ikke spore det igen lige nu.)

Så ... Skal der holdes covariater, der ikke viser sig at være statistisk signifikante, i beregningen for model? (Jeg har redigeret dette spørgsmål for at præcisere, at covariater alligevel aldrig er i modeloutput ved beregningen.)

For at tilføje komplikationer, hvad hvis covariaterne er statistisk signifikante for nogle undergrupper af dataene (undersæt, der skal behandles separat). Jeg vil som standard ikke beholde et sådant kovariat, ellers skal der bruges forskellige modeller, eller du mangler et statistisk signifikant kovariat i et af tilfældene. Hvis du også har et svar på denne delte sag, skal du dog nævne det.

Generelt set vil jeg sige, at du skal beholde variabler, der er teoretisk vigtige, eller som har været signifikante i tidligere undersøgelser, selvom dine data ikke understøtter deres effekt. Når det er sagt, for at få et mere specifikt svar, synes jeg, at du skal tilføje et par linjer for at forklare din model og dens formål (f.eks. Identificere risikofaktorer, forudsige, ...).

Jeg vil sige, det afhænger. Test er kun indikatorer. Hvis du mener, at der skal være en lille afhængighed, så overvej at holde i modellen. Hvis du også mener, at afhængigheden ikke skal være der, skal du lade den udelades.

OK, så I siger begge, at ikke-betydning ikke * dikterer *, at et kovariat fjernes fra overvejelse, så I har begge faktisk besvaret mit spørgsmål. Jeg bør faktisk omformulere mit spørgsmål for mere tydeligt at angive, at det, jeg spørger, er, om et covariats stastistiske betydning er en * nødvendig betingelse * for at opretholde det ("Betyder ikke-betydning af et covariat, at det skal fjernes ...") , og jeg accepterer en af dine kommentarer som svar.

Før jeg gør det, vil jeg dog sørge for, at jeg bruger den rigtige terminologi. Oprindeligt skrev jeg "holdt i modellen", men det syntes ikke rigtigt, fordi kovariater aldrig vises i modellen. Jeg slog mig ned med "holdt i * beregningen for modellen *" (og "fjernet fra * overvejelse *"), men er der en bedre måde at sige dette på? Hvad er det rigtige udtryk for, hvad kovariatet opbevares i eller fjernes fra?

Jeg bruger beholder / fjerner eller inkluderer / ekskluderer afhængigt af om jeg bruger proceduren for tilbagevenden eller fremad, men det betyder ikke meget for mig ...

Du bliver nødt til at validere den korrekte udførelse af sådanne udvælgelsesprocedurer. Andre har fejlet.