CUM SE UTILIZEAZĂ FUNCȚIA LM() ÎN R PENTRU A SE POTRIVI MODELELOR LINIARE?

În acest articol, vom învăța cum să folosim funcția lm() pentru a se potrivi modelelor liniare în limbajul de programare R.

Un model liniar este utilizat pentru a prezice valoarea unei variabile necunoscute pe baza variabilelor independente. Este folosit mai ales pentru a afla relația dintre variabile și prognoză. Funcția lm() este utilizată pentru a potrivi modele liniare la cadrele de date în limbajul R. Poate fi utilizat pentru a efectua regresia, analiza de varianță pe un singur strat și analiza covarianței pentru a prezice valoarea corespunzătoare datelor care nu se află în cadrul de date. Acestea sunt foarte utile în prezicerea prețului bunurilor imobiliare, prognoza meteo etc.

Pentru a potrivi un model liniar în limbajul R utilizând lm() În primul rând, folosim funcția data.frame() pentru a crea un eșantion de cadru de date care conține valori care trebuie să fie ajustate pe un model liniar folosind funcția de regresie. Apoi folosim funcția lm() pentru a potrivi o anumită funcție la un cadru de date dat.

Sintaxă:

lm(fitting_formula, dataframe )

Parametru:

fitting_formula: determină formula pentru modelul liniar. dataframe: determină numele cadrului de date care conține datele.

Apoi, putem folosi funcția summary() pentru a vizualiza rezumatul modelului liniar. Funcția summary() interpretează cele mai importante valori statistice pentru analiza modelului liniar.

program prime în java

Sintaxă:

rezumat( model_liniar )

Rezumatul conține următoarele informații cheie:

Eroare standard reziduală: determină abaterea standard a erorii în care rădăcina pătrată a varianței scade n minus 1 + # de variabile implicate în loc să se împartă la n-1. Multiple R-Squared: determină cât de bine se potrivește modelul dvs. cu datele. R-Squared ajustat: normalizează Multiple R-Squared luând în considerare câte eșantioane aveți și câte variabile utilizați. F-Statistic: este un test global care verifică dacă cel puțin unul dintre coeficienții tăi este diferit de zero.

Exemplu: Exemplu pentru a arăta utilizarea funcției lm().

R

# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view summary of linear model> summary>(linear_model)>

Ieșire:

Apel:

lm(formula = y ~ x^2, date = df)

Reziduuri:

1 2 3 4 5

2.000e+00 5.329e-15 -3.000e+00 -2.000e+00 3.000e+00

Coeficienți:

Estimare Std. Eroare t valoarea Pr(>|t|)

(Interceptare) -7,0000 3,0876 -2,267 0,10821

x 6,0000 0,9309 6,445 0,00757 **

—

Signif. coduri: 0 ‘***’ 0,001 ‘**’ 0,01 ‘*’ 0,05 ‘.’ 0,1 ‘ ’ 1

Eroare standard reziduală: 2.944 pe 3 grade de libertate

R-pătrat multiplu: 0,9326, R-pătrat ajustat: 0,9102

F-statistică: 41,54 pe 1 și 3 DF, valoare p: 0,007575

Diagnostice parcele

Diagramele de diagnostic ne ajută să vedem relația dintre diferitele valori statistice ale modelului. Ne ajută să analizăm amploarea valorii aberante și eficiența modelului adaptat. Pentru a vizualiza diagramele de diagnostic ale unui model liniar, folosim funcția plot() în limbajul R.

Sintaxă:

plot(linear_model)

Exemplu: Diagrame de diagnostic pentru modelul liniar montat mai sus.

R

# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view diagnostic plot> plot>(linear_model)>

Ieșire:

Trasarea modelului liniar

Putem reprezenta modelul liniar de mai sus pentru a-l vizualiza bine folosind metoda abline(). Mai întâi trasăm un grafic de împrăștiere a punctelor de date și apoi îl suprapunem cu un grafic abline al modelului liniar folosind funcția abline().

Sintaxă:

plot( df$x, df$y)
centrarea imaginilor în css

abline (model_liniar)

Exemplu: Trasarea modelului liniar

R

șir la int

# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Plot abline plot> plot>( df$x, df$y )> abline>( linear_model)>

Ieșire:

Preziceți valori pentru puncte de date necunoscute folosind modelul adaptat

Pentru a prezice valori pentru intrări noi folosind modelul liniar adaptat mai sus, folosim funcția predict(). Funcția predict() preia modelul și cadrul de date cu puncte de date necunoscute și prezice valoarea pentru fiecare punct de date conform modelului adaptat.

Sintaxă:

prezice (model, date)

Parametru:

model: determină modelul liniar. date: determină cadrul de date cu puncte de date necunoscute.

Exemplu: Prezicerea intrărilor noi

R

# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Predict values> predict>( linear_model, newdata =>data.frame>(x=>c>(15,16,17)) )>

Ieșire:

1 2 3 83 89 95>

TechCodeview

R

Diagnostice parcele

R

Trasarea modelului liniar

R

Preziceți valori pentru puncte de date necunoscute folosind modelul adaptat

R