R limbaj de programare este un limbaj de programare open-source care este utilizat pe scară largă ca software statistic și instrument de analiză a datelor. Cadre de date în limbajul R sunt obiecte de date generice ale lui R care sunt utilizate pentru a stoca date tabelare.
Cadrele de date pot fi, de asemenea, interpretate ca matrici în care fiecare coloană a a matrice pot fi de diferite tipuri de date. R DataFrame este alcătuit din trei componente principale, date, rânduri și coloane.
R Structura cadrelor de date
După cum puteți vedea în imaginea de mai jos, așa este structurat un cadru de date.
Datele sunt prezentate sub formă de tabel, ceea ce facilitează operarea și înțelegerea.

R – Cadre de date
Creați un cadru de date în limbajul de programare R
Pentru a crea un cadru de date R utilizați data.frame() funcția și apoi transmiteți fiecare dintre vectorii pe care i-ați creat ca argumente funcției.
R
# R program to create dataframe> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # print the data frame> print>(friend.data)> |
>
>
Ieșire:
friend_id friend_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>
Obțineți structura cadrului de date R
Se poate obține structura cadrului de date R folosind str() funcția în R.
Poate afișa chiar și structura internă a listelor mari care sunt imbricate. Oferă o ieșire cu o singură linie pentru obiectele de bază R, permițând utilizatorului să știe despre obiect și constituenții acestuia.
R
câte uncii sunt 10 mililitri
# R program to get the> # structure of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using str()> print>(>str>(friend.data))> |
>
>
Ieșire:
'data.frame': 5 obs. of 2 variables: $ friend_id : int 1 2 3 4 5 $ friend_name: chr 'Sachin' 'Sourav' 'Dravid' 'Sehwag' ... NULL>
Rezumatul datelor din cadrul de date R
În cadrul de date R, rezumatul statistic și natura datelor pot fi obținute prin aplicare rezumat() funcţie.
Este o funcție generică utilizată pentru a produce rezumate ale rezultatelor diferitelor funcții de adaptare a modelului. Funcția invocă anumite metode care depind de clasa primului argument.
R
# R program to get the> # summary of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using summary()> print>(>summary>(friend.data))> |
>
>
Ieșire:
friend_id friend_name Min. :1 Length:5 1st Qu.:2 Class :character Median :3 Mode :character Mean :3 3rd Qu.:4 Max. :5>
Extrageți datele din cadrul de date în R
Extragerea datelor dintr-un cadru de date R înseamnă că accesarea rândurilor sau coloanelor acestuia. Se poate extrage o coloană specifică dintr-un cadru de date R folosind numele coloanei sale.
R
# R program to extract> # data from the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Extracting friend_name column> result <->data.frame>(friend.data$friend_name)> print>(result)> |
>
>
Ieșire:
friend.data.friend_name 1 Sachin 2 Sourav 3 Dravid 4 Sehwag 5 Dhoni>
Extindeți Cadrul de date în limbajul R
Un cadru de date în R poate fi extins prin adăugarea de noi coloane și rânduri la cadrul de date R deja existent.
R
# R program to expand> # the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Expanding data frame> friend.data$location <->c>(>'Kolkata'>,>'Delhi'>,> >'Bangalore'>,>'Hyderabad'>,> >'Chennai'>)> resultant <- friend.data> # print the modified data frame> print>(resultant)> |
>
cum se concatenează șiruri în java
>
Ieșire:
friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>
În R, se pot efectua diverse tipuri de operații pe un cadru de date, cum ar fi accesarea rândurilor și coloanelor, selectarea subsetului din cadrul de date, editarea cadrelor de date, ștergerea rândurilor și coloanelor dintr-un cadru de date , etc.
Va rog, referiti-va la Operații DataFrame în R să cunoască toate tipurile de operații care pot fi efectuate pe un cadru de date.
Accesați elementele din cadrul de date R
Putem selecta și accesa orice element din cadrul de date utilizând single$>, paranteze[ ] or>paranteze duble[[]]>pentru a accesa coloanele dintr-un cadru de date.
R
# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Access Items using []> friend.data[1]> # Access Items using [[]]> friend.data[[>'friend_name'>]]> # Access Items using $> friend.data$friend_id> |
>
>
Ieșire:
friend_id 1 1 2 2 3 3 4 4 5 5 Access Items using [[]] [1] 'Sachin' 'Sourav' 'Dravid' 'Sehwag' 'Dhoni' Access Items using $ [1] 1 2 3 4 5>
Numărul de rânduri și coloane
Putem afla câte rânduri și coloane parsant în cadrul nostru de date utilizând funcția dim.
R
# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # find out the number of rows and clumns> dim>(friend.data)> |
>
>
Ieșire:
[1] 5 2>
Adăugați rânduri și coloane în cadrul de date R
Puteți adăuga cu ușurință rânduri și coloane într-un R DataFrame. Inserarea ajută la extinderea DataFrame-ului deja existent, fără a fi nevoie de unul nou.
Să ne uităm la cum să adăugați rânduri și coloane într-un DataFrame? cu un exemplu:
Adăugați rânduri în cadrul de date R
Pentru a adăuga rânduri într-un cadru de date, puteți utiliza o funcție încorporată rbind().
Următorul exemplu demonstrează funcționarea lui rbind() în R Data Frame.
R
subcomisar de poliție
# Creating a dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products):
'>)> print>(Products)> # Adding a new row for a new product> New_Product <->c>(104,>'Sunglasses'>, 39.99, 40)> Products <->rbind>(Products, New_Product)> # Print the updated dataframe after adding the new product> cat>(>'
Updated dataframe after adding a new product:
'>)> print>(Products)> |
>
>
Ieșire:
Existing dataframe (Products): Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 Updated dataframe after adding a new product: Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 4 104 Sunglasses 39.99 40>
Adăugați coloane în cadrul de date R
Pentru a adăuga coloane într-un cadru de date, puteți utiliza o funcție încorporată cbind().
Următorul exemplu demonstrează funcționarea cbind() în R Data Frame .
R
# Existing dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products):
'>)> print>(Products)> # Adding a new column for 'Discount' to the dataframe> Discount <->c>(5, 10, 8)># New column values for discount> Products <->cbind>(Products, Discount)> # Rename the added column> colnames>(Products)[>ncol>(Products)] <->'Discount'> # Renaming the last column> # Print the updated dataframe after adding the new column> cat>(>'
Updated dataframe after adding a new column 'Discount':
'>)> print>(Products)> |
>
>
Ieșire:
Existing dataframe (Products): Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 Updated dataframe after adding a new column 'Discount': Product_ID Product_Name Price Stock Discount 1 101 T-Shirt 15.99 50 5 2 102 Jeans 29.99 30 10 3 103 Shoes 49.99 25 8>
Eliminați rândurile și coloanele
Un cadru de date în R elimină coloanele și rândurile din cadrul de date R deja existent.
Eliminați rândul din R DataFrame
R
library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove a row with friend_id = 3> data <->subset>(data, friend_id != 3)> data> |
>
>
Ieșire:
friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai # Remove a row with friend_id = 3 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>
În codul de mai sus, am creat mai întâi un cadru de date numit date cu trei coloane: friend_id , nume_prieten , și Locație . Pentru a elimina un rând cu friend_id egal cu 3, am folosit subset() funcția și a specificat condiția friend_id != 3 . Acest lucru a eliminat rândul cu friend_id egal cu 3.
Eliminați coloana din R DataFrame
R
library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove the 'location' column> data <->select>(data, -location)> data> |
>
șir de intrare java
>
Ieșire:
friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>Eliminați coloana 'location' friend_id friend_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>>>Pentru a elimina Locație coloana, am folosit Selectați() funcţie şi specificate -Locație . The – semnul indică faptul că vrem să eliminăm Locație coloană. Cadrul de date rezultat date va avea doar două coloane: friend_id și nume_prieten .
Combinarea cadrelor de date în R
Există 2 moduri de a combina cadre de date în R. Le puteți combina fie pe verticală, fie pe orizontală.
Să ne uităm la ambele cazuri cu un exemplu:
Combinați R Data Frame pe verticală
Dacă doriți să combinați 2 cadre de date pe verticală, puteți utiliza funcția rbind(). Această funcție funcționează pentru combinarea a două sau mai multe cadre de date.
R
# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Name =>c>(>'Charlie'>,>'David'>),> >Age =>c>(28, 35),> >Score =>c>(90, 85)> )> # Print the existing dataframes> cat>(>'Dataframe 1:
'>)> print>(df1)> cat>(>'
Dataframe 2:
'>)> print>(df2)> # Combining the dataframes using rbind()> combined_df <->rbind>(df1, df2)> # Print the combined dataframe> cat>(>'
Combined Dataframe:
'>)> print>(combined_df)> |
>
Ieșire:
Dataframe 1: Name Age Score 1 Alice 25 80 2 Bob 30 75 Dataframe 2: Name Age Score 1 Charlie 28 90 2 David 35 85 Combined Dataframe: Name Age Score 1 Alice 25 80 2 Bob 30 75 3 Charlie 28 90 4 David 35 85>
Combinați Cadrul de date R pe orizontală:
Dacă doriți să combinați 2 cadre de date pe orizontală, puteți utiliza funcția cbind(). Această funcție funcționează pentru combinarea a două sau mai multe cadre de date.
R
# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Height =>c>(160, 175),> >Weight =>c>(55, 70)> )> # Print the existing dataframes> cat>(>'Dataframe 1:
'>)> print>(df1)> cat>(>'
Dataframe 2:
'>)> print>(df2)> # Combining the dataframes using cbind()> combined_df <->cbind>(df1, df2)> # Print the combined dataframe> cat>(>'
Combined Dataframe:
'>)> print>(combined_df)> |
>
>
Ieșire:
Dataframe 1: Name Age Score 1 Alice 25 80 2 Bob 30 75 Dataframe 2: Height Weight 1 160 55 2 175 70 Combined Dataframe: Name Age Score Height Weight 1 Alice 25 80 160 55 2 Bob 30 75 175 70>
Citește și:
- R – Obiecte
- Structuri de date în programarea R
În acest articol am acoperit R Cadre de date, și toate operațiunile de bază, cum ar fi crearea, accesarea, rezumatul, adăugarea și eliminarea. Acest articol are scopul de a vă familiariza cu cadrele de date în R, astfel încât să le puteți utiliza în proiectele dvs.
Sper că acest lucru vă ajută să înțelegeți conceptul de cadre de date în R și puteți implementa cu ușurință cadrul de date R în proiectele dvs.