logo

Boxploturi în limbajul R

Un grafic cu casete este o diagramă care este utilizată pentru a afișa informații sub formă de distribuție prin desenarea unor diagrame cu casete pentru fiecare dintre ele. Această distribuție a datelor se bazează pe cinci seturi (minimum, primul quartila, mediana, al treilea quartila și maxim).

Boxplots în R limbaj de programare

Boxploturile sunt create în R utilizând boxplot() funcţie.



Sintaxă: boxplot(x, date, notch, varwidth, names, main)

Parametri:

    x: Acest parametru se setează ca un vector sau o formulă. date: Acest parametru setează cadrul de date. crestătură: Acest parametru este eticheta pentru axa orizontală. varwidth: Acest parametru este o valoare logică. Setați ca adevărat pentru a desena lățimea casetei proporțională cu dimensiunea eșantionului. main: Acest parametru este titlul diagramei. nume: acest parametru sunt etichetele grupurilor care vor fi afișate sub fiecare boxplot.

Crearea unui set de date

Pentru a înțelege cum putem crea un boxplot:



  • Folosim setul de date mtcars.
  • Să ne uităm la coloanele mpg și cyl în mtcars.

R




citiți din fișierul csv în java



input <- mtcars[,>c>(>'mpg'>,>'cyl'>)]> print>(>head>(input))>

>

>

Ieșire:

 mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6>

Crearea Boxplot-ului

Crearea graficului Boxplot.

  • Luați parametrii necesari pentru a realiza un boxplot.
  • Acum desenăm un grafic pentru relația dintre mpg și cyl.

R




# Load the dataset> data>(mtcars)> # Create the box plot> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>,> >xlab =>'Gear'>,> >ylab =>'Displacement'>)>

>

>

Ieșire:

Box plot în RGeeksforgeeks

Box plot în R

Boxplot folosind notch

Pentru a desena un boxplot folosind o crestătură:

  • Cu ajutorul Notch, putem afla cum medianele diferitelor grupuri de date se potrivesc între ele.

R


10 din 1 milion



# Load the dataset> data>(mtcars)> # Set up plot colors> my_colors <->c>(>'#FFA500'>,>'#008000'>,>'#1E90FF'>,>'#FF1493'>)> # Create the box plot with customized aesthetics> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>, xlab =>'Gear'>, ylab =>'Displacement'>,> >col = my_colors, border =>'black'>, notch =>TRUE>, notchwidth = 0.5,> >medcol =>'white'>, whiskcol =>'black'>, boxwex = 0.5, outpch = 19,> >outcol =>'black'>)> # Add a legend> legend>(>'topright'>, legend =>unique>(mtcars$gear),> >fill = my_colors, border =>'black'>, title =>'Gear'>)>

>

>

Ieșire:

Box plot în RGeeksforgeeks

Box Plot în R

col: Utilizează un vector de culori (my_colors) pentru a schimba culoarea de umplere a casetelor.
frontiere: Setează culoarea chenarelor casetei la negru.
crestătură: Pentru a ilustra intervalele de încredere, se adaugă o crestătură în casete.
lățimea crestăturii: Gestionează lățimea crestăturilor.
medcol: Face culoarea liniei mediane albe.
whiskcol: Setează culoarea mustăților la negru cu comanda whiskcol.
boxwex: Modifică lățimea casetelor.
outpch : Setează formele valorii aberante la cercuri solide.
outcol: Schimbă culoarea valorii aberante în negru.

Boxplot multiplu

Aici creăm mai multe boxplot. Datele individuale pentru care este necesară o reprezentare boxplot se bazează pe funcție.

R




# Load the dataset> data>(mtcars)> # Define the variables for the box plots> variables <->c>(>'mpg'>,>'disp'>,>'hp'>,>'wt'>)> # Set up the plotting layout> par>(mfrow =>c>(1,>length>(variables)))> # Create the box plots> for>(var>in> variables) {> >boxplot>(>get>(var) ~ gear, data = mtcars,> >main =>paste>(>'Box Plot of'>, var),> >xlab =>'Gear'>,> >ylab = var,> >col =>'skyblue'>,> >border =>'black'>,> >notch =>TRUE>,> >notchwidth = 0.5,> >medcol =>'white'>,> >whiskcol =>'black'>,> >boxwex = 0.5,> >outpch = 19,> >outcol =>'black'>)> }> # Reset the plotting layout> par>(mfrow =>c>(1, 1))>

>

checkout cu git
>

Ieșire:

Mai multe box plots în RGeeksforgeeks

Diagrame cu case multiple în R

  • În acest cod, începem prin a enumera variabilele din vectorul de variabile pentru care dorim să facem diagrame cu casete. Am adăugat mpg, disp, hp și wt în acest exemplu, dar puteți modifica această listă pentru a se potrivi nevoilor dvs.
  • Aspectul grafic este apoi creat folosind funcția par și sintaxa mfrow = c(1, length(variables)), care generează o grilă cu un rând și atâtea coloane câte variabile există în vectorul de variabile.
  • Folosim funcția boxplot în interiorul buclei pentru a genera un box plot pentru fiecare variabilă. Funcția get(var) extrage în mod dinamic valorile coloanei potrivite din setul de date. Folosind setările date, modificăm aspectul fiecărei casete.