logo

Testul Chi-Pătrat în R

The testul chi-pătrat de independenţă evaluează dacă există o asociere între categoriile celor două variabile. Există, în principiu, două tipuri de variabile aleatoare și produc două tipuri de date: numerice și categoriale. În R limbaj de programare Statistica chi-pătrat este utilizată pentru a investiga dacă distribuțiile variabilelor categoriale diferă unele de altele. Testul chi-pătrat este, de asemenea, util în timp ce se compară conturile sau numărul răspunsurilor categorice între două (sau mai multe) grupuri independente.

În limbajul de programare R, funcția utilizată pentru efectuarea unui test chi-pătrat este chisq.test()> .



Sintaxă:

chisq.test(date)

jtextfield

Parametri:



date : data este un tabel care conține valorile de numărare ale variabilelor din tabel.

Vom prelua datele sondajului în MASS> bibliotecă care reprezintă datele dintr-un sondaj efectuat pe elevi.

R






# load the MASS package> library>(MASS)> print>(>str>(survey))>

>

>

Ieșire:

'data.frame': 237 obs. of 12 variables:  $ Sex : Factor w/ 2 levels 'Female','Male': 1 2 2 2 2 1 2 1 2 2 ...  $ Wr.Hnd: num 18.5 19.5 18 18.8 20 18 17.7 17 20 18.5 ...  $ NW.Hnd: num 18 20.5 13.3 18.9 20 17.7 17.7 17.3 19.5 18.5 ...  $ W.Hnd : Factor w/ 2 levels 'Left','Right': 2 1 2 2 2 2 2 2 2 2 ...  $ Fold : Factor w/ 3 levels 'L on R','Neither',..: 3 3 1 3 2 1 1 3 3 3 ...  $ Pulse : int 92 104 87 NA 35 64 83 74 72 90 ...  $ Clap : Factor w/ 3 levels 'Left','Neither',..: 1 1 2 2 3 3 3 3 3 3 ...  $ Exer : Factor w/ 3 levels 'Freq','None',..: 3 2 2 2 3 3 1 1 3 3 ...  $ Smoke : Factor w/ 4 levels 'Heavy','Never',..: 2 4 3 2 2 2 2 2 2 2 ...  $ Height: num 173 178 NA 160 165 ...  $ M.I : Factor w/ 2 levels 'Imperial','Metric': 2 1 NA 2 2 1 1 2 2 2 ...  $ Age : num 18.2 17.6 16.9 20.3 23.7 ... NULL>

Rezultatul de mai sus arată că setul de date are multe variabile factor care pot fi considerate variabile categoriale. Pentru modelul nostru, vom lua în considerare variabilele Exer și Fum .Coloana Fum înregistrează obiceiurile de fumat al elevilor, în timp ce coloana Exer înregistrează nivelul lor de exercițiu. Scopul nostru este de a testa ipoteza dacă obiceiul de fumat al elevilor este independent de nivelul lor de exercițiu la un nivel de semnificație de .05.

R


harta in java



# Create a data frame from the main data set.> stu_data =>data.frame>(survey$Smoke,survey$Exer)> # Create a contingency table with the needed variables.> stu_data =>table>(survey$Smoke,survey$Exer)> > print>(stu_data)>

>

>

Ieșire:

 Freq None Some  Heavy 7 1 3  Never 87 18 84  Occas 12 3 4  Regul 9 1 7>

Și în sfârșit aplicăm chisq.test()> funcția la tabelul de contingență stu_data.

R




sql count distinct
# applying chisq.test() function> print>(>chisq.test>(stu_data))>

>

>

Ieșire:

 Pearson's Chi-squared test  data: stu_data X-squared = 5.4885, df = 6, p-value = 0.4828>

Deoarece valoarea p 0,4828 este mai mare decât .05, concluzionăm că obiceiul de fumat este independent de nivelul de exercițiu al elevului și, prin urmare, există o corelație slabă sau deloc între cele două variabile. Codul R complet este prezentat mai jos.

Deci, în rezumat, se poate spune că este foarte ușor să se efectueze un test Chi-pătrat folosind R. Se poate realiza această sarcină folosind chisq.test()> funcția în R.

Vizualizați datele testului Chi-pătrat

R




# Load required library> library>(MASS)> # Print structure of the survey dataset> print>(>str>(survey))> # Create a data frame for smoking and exercise columns> stu_data <->data.frame>(survey$Smoke, survey$Exer)> stu_data <->table>(survey$Smoke, survey$Exer)> # Print the table> print>(stu_data)> # Perform the Chi-Square Test> chi_result <->chisq.test>(stu_data)> print>(chi_result)> # Visualize the data with a bar plot> barplot>(stu_data, beside =>TRUE>, col =>c>(>'lightblue'>,>'lightgreen'>),> >main =>'Smoking Habits vs Exercise Levels'>,> >xlab =>'Exercise Level'>, ylab =>'Number of Students'>)> # Add legend separately> legend>(>'center'>, legend =>rownames>(stu_data), fill =>c>(>'lightblue'>,>'lightgreen'>))>

>

>

Ieșire:

gh

Testul Chi-pătrat în R

string convert în int în java

În acest cod folosimMASS>bibliotecă pentru a efectua un test Chi-Pătrat pe setul de date „sondaj”, concentrându-se pe relația dintre obiceiurile de fumat și nivelul de exerciții fizice.

Acesta creează un tabel de contingență, efectuează testul statistic și vizualizează datele folosind un grafic cu bare. Legenda este adăugată separat în colțul din stânga sus, făcând distincție între diferitele obiceiuri de fumat cu culori distincte.

Codul își propune să exploreze și să comunice asocierile dintre comportamentul de fumat și practicile de exerciții fizice în cadrul setului de date.