logo

Python | Pandas DataFrame.set_index()

În acest articol, vom discuta despre Pandas DataFrame.set_index() în Python. Piton se remarcă ca un limbaj excelent pentru analiza datelor, în mare parte datorită ecosistemului său remarcabil de pachete centrate pe date. Printre aceste pachete, panda joacă un rol semnificativ în simplificarea importului și analizării datelor.

Sintaxă Pandas DataFrame.set_index().

Sintaxă: DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)

Parametri:



  • chei: Numele coloanei sau o listă de nume de coloane.
  • cădere brusca: O valoare booleană care, dacă este adevărată, elimină coloana utilizată pentru index.
  • adăuga: Dacă este adevărat, adaugă coloana specificată la coloana index existentă.
  • la loc: Dacă este adevărat, modificările sunt făcute în DataFrame însuși.
  • verificare_integritate: Dacă este adevărat, verifică noua coloană index pentru duplicate.

Ce este Pandas DataFrame.set_index()?

Cadrul de date Pandas. set_index() metoda este utilizată pentru a atribui o listă, o serie sau un alt cadru de date ca index al unui cadru de date dat. Este deosebit de util atunci când se combină mai multe cadre de date, permițând modificarea ușoară a indexului. În timp ce o coloană de index poate fi specificată în timpul creării cadrului de date, set_index() oferă o modalitate flexibilă de a schimba indexul mai târziu. În esență, vă permite să setați o listă, o serie sau un cadru de date ca index al unui cadru de date. Dar uneori un cadru de date este format din două sau mai multe cadre de date și, prin urmare, indexul ulterior poate fi modificat folosind această metodă.

Pentru a descărca fișierul CSV folosit, faceți clic Aici.

Pandas DataFrame.set_index() Exemple

Mai jos sunt ilustrații adecvate ale exemplelor pentru Pandas DataFrame.set_index().

  • Pandas Setează Index la coloană
  • Coloană cu index multiplu
  • Setarea unui singur Coloana plutitoare ca Index
  • Setare trei coloane la fel de MultiIndex
  • Pandas setează indexul unei coloane specifice

Pandas Setează Index la coloană

În acest exemplu, modificăm coloana Index, coloana Prenume a devenit coloana index a Cadrului de date.

Python3




# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index(>'First Name'>, inplace>=> True>)> # display> data.head()>

împărțirea unui șir în c++
>

>

Ieșire : Înainte de operare -

După operație -

După cum se arată în imaginile de ieșire, mai devreme coloana index era o serie de numere, dar mai târziu a fost înlocuită cu Prenume.

Pandas Setează indexul la coloană cu index multiplu

În acest exemplu, două coloane vor fi făcute ca coloană index. Parametrul de eliminare este folosit pentru a elimina coloana, iar parametrul de adăugare este utilizat pentru a adăuga coloanele trecute la coloana de index deja existentă.

Python3

formatator de șiruri




# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index([>'First Name'>,>'Gender'>], inplace>=> True>,> >append>=> True>, drop>=> False>)> # display> data.head()>

>

>

face scriptul executabil

Ieșire:

După cum se arată în imaginea de ieșire, datele au 3 coloane index.

Pandas Dataframe Index Setarea unui singur Coloana plutitoare ca Index

În acest exemplu, fragmentul de cod de mai jos folosește biblioteca Pandas pentru a crea un DataFrame numit „df” dintr-o listă imbricată de date elevilor. Setează coloana „Agg_Marks” ca index și afișează DataFrame rezultat cu coloanele „Nume”, „Vârsta”, „Oraș” și „Țară”.

Python3




# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # here we set Float column 'Agg_Marks' as index of data frame> # using dataframe.set_index() function> df>=> df.set_index(>'Agg_Marks'>)> # Displaying the Data frame> df>

valoarea șirului java

>

>

Ieșire:

 Name Age City Country Agg_Marks 85.96 jack 34 Sydeny Australia 95.20 Riti 30 Delhi India 85.25 Vansh 31 Delhi India 74.21 Nanyu 32 Tokyo Japan 99.63 Maychan 16 New York US 47.28 Mike 17 las vegas US>

În exemplul de mai sus, setăm coloana „ Agg_Marks ‘ ca index al cadrului de date.

Setare Pandas Dataframe Index trei coloane la fel de MultiIndex

În acest exemplu, codul de mai jos utilizează Pandas pentru a crea un DataFrame „df” din datele studenților, cu coloanele „Nume”, „Vârsta”, „Oraș”, „Țară”, „Marcă_Agg” și „ID”. Folosește funcția „set_index()” pentru a stabili un index pe mai multe niveluri folosind „Nume”, „Oraș” și „ID”, apoi afișează DataFrame rezultat.

Python3




# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>,>400>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>,>750>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>,>101>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>,>900>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>,>420>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>,>555>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>,>'ID'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # Here we pass list of 3 columns i.e 'Name', 'City' and 'ID'> # to dataframe.set_index() function> # to set them as multiIndex of dataframe> df>=> df.set_index([>'Name'>,>'City'>,>'ID'>])> # Displaying the Data frame> df>

>

>

Ieșire:

 Age Country Agg_Marks Name City ID jack Sydeny 400 34 Australia 85.96 Riti Delhi 750 30 India 95.20 Vansh Delhi 101 31 India 85.25 Nanyu Tokyo 900 32 Japan 74.21 Maychan New York 420 16 US 99.63 Mike las vegas 555 17 US 47.28>

În exemplul de mai sus, setăm coloanele „ Nume ', ' Oraș ', și ' ID ‘ ca multiIndex al cadrului de date.

Pandas setează indexul unei coloane specifice

În acest exemplu, codul de mai jos demonstrează cum să utilizați Pandas pentru a crea un DataFrame, setați o coloană specifică („Nume” în acest caz) ca index folosindset_index()>metoda și apoi afișează atât cadrele de date originale, cât și cele modificate. Theinplace=True>parametrul asigură că modificările sunt aplicate direct DataFrame fără a fi nevoie de reatribuire.

Python3


metoda equals în java



import> pandas as pd> # Creating a sample DataFrame> data>=> {>'Name'>: [>'Geek1'>,>'Geek2'>,>'Geek3'>],> >'Age'>: [>25>,>30>,>35>],> >'City'>: [>'New York'>,>'San Francisco'>,>'Los Angeles'>]}> df>=> pd.DataFrame(data)> # Displaying the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Using set_index() to set 'Name' column as the index> df.set_index(>'Name'>, inplace>=>True>)> # Displaying the DataFrame after setting the index> print>(>' DataFrame after set_index:'>)> print>(df)>

>

>

Ieșire:

Original DataFrame: Name Age City 0 Geek1 25 New York 1 Geek2 30 San Francisco 2 Geek3 35 Los Angeles DataFrame after set_index: Age City Name Geek1 25 New York Geek2 30 San Francisco Geek3 35 Los Angeles>