Hvad er en komplet liste over de sædvanlige antagelser for lineær regression?

tony

2011-10-03 09:19:19 UTC

view on stackexchange narkive permalink

Hvad er de sædvanlige antagelser for lineær regression?

Indeholder de:

et lineært forhold mellem den uafhængige og afhængige variabel
uafhængige fejl
normal fordeling af fejl
homoscedasticity

Er der andre?

Du kan finde en temmelig komplet liste i William Berrys lille bog om "Understanding Regression Assumptions": http://books.google.com/books/about/Understanding_regression_assumptions.html?id=4_Aeo9JdzCMC

Mens respondenterne har opført nogle gode ressourcer, er det et vanskeligt spørgsmål at besvare i dette format, og (mange) bøger er udelukkende viet til dette emne. Der er ingen kogebog, og der bør heller ikke gives den potentielle række situationer, som lineær regression kan omfatte.

Technically, (ordinary) linear regression is a model of the form $\mathbb{E}[Y_i] = \mathbf{X}_i \beta$, $Y_i$ iid. That simple mathematical statement encompasses *all* the assumptions. This leads me to think, AiliifnrvhCMT W, that you may be interpreting the question more broadly, perhaps in the sense of the art and practice of regression. Your further thoughts about this might be useful here.

Jeg antog (måske forkert), at de antagelser, som OP taler om, er med hensyn til at gøre * gyldige slutninger * baseret på $ \ beta $ estimaterne, som kræver større begrænsninger end dem, der simpelthen gør det muligt at identificere $ \ beta $ (som nævnt af @whuber). Det ville kræve afklaring fra tony, selv om min antagelse er korrekt (og hvis det er min første kommentar stadig, ved at det er så bredt, ville det være vanskeligt (men ikke umuligt) at skrive et svar med et så bredt omfang) .

@Andy W Jeg prøvede ikke at foreslå, at din fortolkning var forkert. Din kommentar foreslog en måde at tænke på spørgsmålet på, der går ud over tekniske antagelser og måske peger på, hvad der kan være nødvendigt for en gyldig fortolkning af regressionsresultater. Det ville ikke være nødvendigt at skrive en afhandling som svar, men selv en liste over nogle af disse bredere emner kunne være oplysende og kunne udvide omfanget og interessen for denne tråd.

@whuber, hvis $ EY_i = X_i \ beta $ betyder det, at midlerne er forskellige for forskellige $ i $, derfor kan $ Y_i $ ikke betegnes :)

@mp Du har ret; Jeg burde have mere omhyggeligt sagt, at $ Y_i - \ mathbf {X} _i \ beta $ er iid.

Jeg fandt [denne side] (http://www.duke.edu/~rnau/testing.htm) ret hjælpsom til en gennemgang af antagelser og måder at teste dem på.

En omfattende liste over antagelsen om det klassiske lineære regressionsmodel kan findes her: http://economictheoryblog.com/2015/04/01/ols_assumptions/ Det er vigtigt at bemærke, at konsekvenserne med hensyn til gyldighed af din model afhænger af, hvilkenantagelse er krænket.

Hvilken type lineær regression (også GLM, Deming osv.)?

Til sidst kan de fire antagelser, som OP nævner, let huskes ved hjælp af akronymet LINE: - Linearitet - Uafhængighed - Normalitet - Lige variation

Lineære regressionsantagelser: Nøglepunkter

Upartiskhed / konsistens

Forståelse af koefficienternes præcision

Forskellige antagelser kan bruges til at retfærdiggøre OLS

1. Små prøveantagelser

2. Store prøveforudsætninger

Referencer