Følgende svarer ikke nøjagtigt på spørgsmålet. Det kan dog give dig nogle ideer. Det er noget, jeg for nylig gjorde for at vurdere tilpasningen af flere regressionsmodeller ved hjælp af en til fire uafhængige variabler (den afhængige variabel var i den første kolonne i df1 dataframe).
# opret kombinationerne af de 4 uafhængige variablerbibliotek (foreach) xcomb <- foreach (i = 1: 4, .combine = c)% do% {combn (names (df1) [- 1], i, simplify = FALSE)} # create formulasformlist <- lapply (xcomb, function (l) formula (paste (names (df1) [1], paste (l, collaps = "+"), sep = "~ ")))
Indholdet af as.character (formliste) var
[1]" pris ~ sqft "" pris ~ alder "[3 ] "pris ~ feats" "pris ~ skat" [5] "pris ~ sqft + alder" "pris ~ sqft + feats" [7] "pris ~ sqft + skat" "pris ~ alder + feats" [9] "pris ~ alder + skat "" pris ~ feats + skat "[11]" pris ~ sqft + alder + feats "" pris ~ sqft + alder + skat "[13]" pris ~ sqft + feats + skat "" pris ~ alder + feats + tax "[15]" pris ~ sqft + age + feats + tax "
Så indsamlede jeg nogle nyttige indeks
# R squaredmodels.r.sq <- sapply (formliste, funktion (i) resume (lm (i)) $ r.squared) # justeret R squaredmodels.adj.r.sq <- sapply (formlist, funktion (i) oversigt (lm (i)) $ adj.r.squared) # MSEpmodels.MSEp <- sapply (formliste, funktion (i) anova (lm (i)) ['Mean Sq'] ['Residuals', ]) # Fuld model MSEMSE <- anova (lm (formliste [[længde (formliste)]])) ['Mean Sq'] ['Residuals',] # Mallow's Cpmodels.Cp <- sapply (formlist, funktion (i) {SSEp <- anova (lm (i)) ['Sum Sq'] ['Residuals',] mod.mat <- model.matrix (lm (i)) n <- dim (mod.mat) [1] p <- dim (mod.mat) [2] c (p, SSEp / MSE - (n - 2 * p))})
df.model.eval <- data.frame (model = som.karakter (formliste), p = modeller.Cp [1,], r.sq = modeller.r.sq, adj.r.sq = modeller.adj. r.sq, MSEp = models.MSEp, Cp = models.Cp [2,])
Den endelige dataramme var
model p r.sq adj.r.sq MSEp Cp1 pris ~ sqft 2 0.71390776 0.71139818 42044.46 49.2606202 pris ~ alder 2 0.02847477 0.01352823 162541.84 292.4620493 pris ~ feats 2 0.17858447 0.17137907 120716.21 351.0044414 pris ~ skat 0.7353.053 ~ sqft + feats 3 0.72245824 0.71754599 41148.82 46.4410027 pris ~ sqft + skat 3 0.79837622 0.79446120 30536.19 5.8197668 pris ~ alder + feats 3 0.16146638 0.13526220 142483.62 245.8030269 pris ~ alder + skat 3 0.77886989 0,7788698 21.02106011 pris ~ sqft + alder + bedrifter 4 0.80454221 0.79523470 33739.36 12.51417512 pris ~ sqft + alder + skat 4 0.82977846 0.82140691 29640.97 3.83269213 pris ~ sqft + feats + skat 4 0.80068220 0.79481991 30482.90 6.60950214 pris 0.710821 ~ sqft + age + feats + tax 5 0.83210849 0.82091573 29722.50 5.000000
Endelig et Cp-plot (ved hjælp af bibliotek wle)