Un grafic cu casete este o diagramă care este utilizată pentru a afișa informații sub formă de distribuție prin desenarea unor diagrame cu casete pentru fiecare dintre ele. Această distribuție a datelor se bazează pe cinci seturi (minimum, primul quartila, mediana, al treilea quartila și maxim).
Boxplots în R limbaj de programare
Boxploturile sunt create în R utilizând boxplot() funcţie.
Sintaxă: boxplot(x, date, notch, varwidth, names, main)
Parametri:
x: Acest parametru se setează ca un vector sau o formulă. date: Acest parametru setează cadrul de date. crestătură: Acest parametru este eticheta pentru axa orizontală. varwidth: Acest parametru este o valoare logică. Setați ca adevărat pentru a desena lățimea casetei proporțională cu dimensiunea eșantionului. main: Acest parametru este titlul diagramei. nume: acest parametru sunt etichetele grupurilor care vor fi afișate sub fiecare boxplot.
Crearea unui set de date
Pentru a înțelege cum putem crea un boxplot:
- Folosim setul de date mtcars.
- Să ne uităm la coloanele mpg și cyl în mtcars.
R
citiți din fișierul csv în java
input <- mtcars[,>c>(>'mpg'>,>'cyl'>)]> print>(>head>(input))> |
>
>
Ieșire:
mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6>
Crearea Boxplot-ului
Crearea graficului Boxplot.
- Luați parametrii necesari pentru a realiza un boxplot.
- Acum desenăm un grafic pentru relația dintre mpg și cyl.
R
# Load the dataset> data>(mtcars)> # Create the box plot> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>,> >xlab =>'Gear'>,> >ylab =>'Displacement'>)> |
>
>
Ieșire:

Box plot în R
Boxplot folosind notch
Pentru a desena un boxplot folosind o crestătură:
- Cu ajutorul Notch, putem afla cum medianele diferitelor grupuri de date se potrivesc între ele.
R
10 din 1 milion
# Load the dataset> data>(mtcars)> # Set up plot colors> my_colors <->c>(>'#FFA500'>,>'#008000'>,>'#1E90FF'>,>'#FF1493'>)> # Create the box plot with customized aesthetics> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>, xlab =>'Gear'>, ylab =>'Displacement'>,> >col = my_colors, border =>'black'>, notch =>TRUE>, notchwidth = 0.5,> >medcol =>'white'>, whiskcol =>'black'>, boxwex = 0.5, outpch = 19,> >outcol =>'black'>)> # Add a legend> legend>(>'topright'>, legend =>unique>(mtcars$gear),> >fill = my_colors, border =>'black'>, title =>'Gear'>)> |
>
>
Ieșire:

Box Plot în R
col: Utilizează un vector de culori (my_colors) pentru a schimba culoarea de umplere a casetelor.
frontiere: Setează culoarea chenarelor casetei la negru.
crestătură: Pentru a ilustra intervalele de încredere, se adaugă o crestătură în casete.
lățimea crestăturii: Gestionează lățimea crestăturilor.
medcol: Face culoarea liniei mediane albe.
whiskcol: Setează culoarea mustăților la negru cu comanda whiskcol.
boxwex: Modifică lățimea casetelor.
outpch : Setează formele valorii aberante la cercuri solide.
outcol: Schimbă culoarea valorii aberante în negru.
Boxplot multiplu
Aici creăm mai multe boxplot. Datele individuale pentru care este necesară o reprezentare boxplot se bazează pe funcție.
R
# Load the dataset> data>(mtcars)> # Define the variables for the box plots> variables <->c>(>'mpg'>,>'disp'>,>'hp'>,>'wt'>)> # Set up the plotting layout> par>(mfrow =>c>(1,>length>(variables)))> # Create the box plots> for>(var>in> variables) {> >boxplot>(>get>(var) ~ gear, data = mtcars,> >main =>paste>(>'Box Plot of'>, var),> >xlab =>'Gear'>,> >ylab = var,> >col =>'skyblue'>,> >border =>'black'>,> >notch =>TRUE>,> >notchwidth = 0.5,> >medcol =>'white'>,> >whiskcol =>'black'>,> >boxwex = 0.5,> >outpch = 19,> >outcol =>'black'>)> }> # Reset the plotting layout> par>(mfrow =>c>(1, 1))> |
>
checkout cu git
>
Ieșire:

Diagrame cu case multiple în R
- În acest cod, începem prin a enumera variabilele din vectorul de variabile pentru care dorim să facem diagrame cu casete. Am adăugat mpg, disp, hp și wt în acest exemplu, dar puteți modifica această listă pentru a se potrivi nevoilor dvs.
- Aspectul grafic este apoi creat folosind funcția par și sintaxa mfrow = c(1, length(variables)), care generează o grilă cu un rând și atâtea coloane câte variabile există în vectorul de variabile.
- Folosim funcția boxplot în interiorul buclei pentru a genera un box plot pentru fiecare variabilă. Funcția get(var) extrage în mod dinamic valorile coloanei potrivite din setul de date. Folosind setările date, modificăm aspectul fiecărei casete.