Biblioteca Pandas din Python este foarte utilă pentru manipularea datelor matematice și este utilizată pe scară largă în domeniul învățării automate. Acesta cuprinde multe metode pentru buna sa functionare. loc() și iloc() sunt una dintre aceste metode. Acestea sunt utilizate în tăierea datelor din Pandas DataFrame . Ele ajută la selectarea convenabilă a datelor din DataFrame în Piton . Sunt folosite la filtrarea datelor în funcție de anumite condiții.
Diferența dintre loc() și iloc() în Pandas DataFrame
Aici, vom vedea diferența dintre funcția loc() și iloc() în Pandas DataFrame. Pentru a vedea și compara diferența dintre acestea două, vom crea un exemplu de Dataframe pe care îl vom folosi în întregul paragraf. Funcționarea ambelor metode este explicată în setul de date eșantion al mașinilor.
python3
clasă vs obiect java
# importing the module> import> pandas as pd> > # creating a sample dataframe> data>=> pd.DataFrame({>'Brand'>: [>'Maruti'>,>'Hyundai'>,>'Tata'>,> >'Mahindra'>,>'Maruti'>,>'Hyundai'>,> >'Renault'>,>'Tata'>,>'Maruti'>],> >'Year'>: [>2012>,>2014>,>2011>,>2015>,>2012>,> >2016>,>2014>,>2018>,>2019>],> >'Kms Driven'>: [>50000>,>30000>,>60000>,> >25000>,>10000>,>46000>,> >31000>,>15000>,>12000>],> >'City'>: [>'Gurgaon'>,>'Delhi'>,>'Mumbai'>,> >'Delhi'>,>'Mumbai'>,>'Delhi'>,> >'Mumbai'>,>'Chennai'>,>'Ghaziabad'>],> >'Mileage'>: [>28>,>27>,>25>,>26>,>28>,> >29>,>24>,>21>,>24>]})> > # displaying the DataFrame> display(data)> |
>
>
Ieșire
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 1 Hyundai 2014 30000 Delhi 27 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 24 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>
Funcția Python loc().
The funcția loc(). este o metodă de selectare a datelor bazată pe etichete, ceea ce înseamnă că trebuie să trecem numele rândului sau coloanei pe care dorim să o selectăm. Această metodă include ultimul element din intervalul trecut în ea, spre deosebire de iloc(). loc() poate accepta datele booleene spre deosebire de iloc(). Multe operații pot fi efectuate folosind metoda loc() cum ar fi
Exemplul 1: Selectarea datelor în funcție de unele condiții
În acest exemplu, codul foloseșteloc>funcția de selectare și afișare a rândurilor din DataFrame unde marca este „Maruti” și kilometrajul este mai mare de 25, afișând informații relevante despre mașinile Maruti cu kilometraj mare.
python3
# selecting cars with brand 'Maruti' and Mileage>25>>> => 'Maruti'>) & (data.Mileage>>>> |
>
>
Ieșire
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 4 Maruti 2012 10000 Mumbai 28>
Exemplul 2: Selectarea unui interval de rânduri din DataFrame
În acest exemplu, codul utilizeazăloc>funcție de extragere și afișare a rândurilor cu indici de la 2 la 5 (inclusiv) din DataFrame, oferind informații despre o gamă specifică de mașini din setul de date.
python3
dimensiunea linguritei
# selecting range of rows from 2 to 5> display(data.loc[>2>:>5>])> |
>
>
Ieșire
Brand Year Kms Driven City Mileage 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29>
Exemplul 3: Actualizarea valorii oricărei coloane
În acest exemplu, codul foloseșteloc>funcția de actualizare a valorilor „Mileage” la 22 pentru mașinile din DataFrame în care anul de fabricație este înainte de 2015. Apoi este afișat DataFrame modificat, reflectând modificările aduse coloanei Mileage.
python3
converti str în int
# updating values of Mileage if Year <2015> data.loc[(data.Year <>2015>), [>'Mileage'>]]>=> 22> display(data)> |
>
>
Ieșire
tipuri de date sql
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 22 1 Hyundai 2014 30000 Delhi 22 2 Tata 2011 60000 Mumbai 22 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 22 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 22 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>
Funcția Python iloc().
The funcția iloc(). este o metodă de selectare bazată pe indexare, ceea ce înseamnă că trebuie să trecem un index întreg în metoda pentru a selecta un anumit rând/coloană. Această metodă nu include ultimul element al intervalului trecut în ea, spre deosebire de loc(). iloc() nu acceptă datele booleene spre deosebire de loc(). Operațiile efectuate folosind iloc() sunt:
Exemplul 1: Selectarea rândurilor folosind indici întregi
În acest exemplu, codul foloseșteiloc>funcție pentru a extrage și afișa anumite rânduri cu indici 0, 2, 4 și 7 din DataFrame, prezentând informații despre mașinile selectate în setul de date.
python3
# selecting 0th, 2nd, 4th, and 7th index rows> display(data.iloc[[>0>,>2>,>4>,>7>]])> |
>
>
Ieșire
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 2 Tata 2011 60000 Mumbai 25 4 Maruti 2012 10000 Mumbai 28 7 Tata 2018 15000 Chennai 21>
Exemplul 2: Selectarea unui interval de coloane și rânduri simultan
În acest exemplu, codul utilizeazăiloc>funcție de extragere și afișare a unui subset al DataFrame, inclusiv rândurile 1 până la 4 și coloanele 2 până la 4. Aceasta oferă informații despre o gamă specifică de mașini și atributele lor relevante în setul de date.
șir de listă java
python3
# selecting rows from 1 to 4 and columns from 2 to 4> display(data.iloc[>1>:>5>,>2>:>5>])> |
>
>
Ieșire
Kms Driven City Mileage 1 30000 Delhi 27 2 60000 Mumbai 25 3 25000 Delhi 26 4 10000 Mumbai 28>