Adăugarea de noi coloane la un DataFrame existent este o sarcină fundamentală în utilizarea analizei datelor panda . Vă permite să vă îmbogățiți datele cu informații suplimentare și să facilitați analiza și manipularea ulterioară. Acest articol va explora diferite metode pentru adăugarea de noi coloane, inclusiv atribuirea simplă,insert()>metoda, ceaassign()>metodă. Să discutăm despre adăugarea de noi coloane la DataFrame-ul existent al lui Pandas.
Ce este Pandas DataFrame?
A Pandas DataFrame este o structură de date tabulară bidimensională, cu dimensiuni modificabile, potențial eterogenă, cu axe etichetate (rânduri și coloane). Este o structură de date fundamentală în ecosistemul științei datelor Python și oferă o modalitate puternică de a lucra cu date tabulare.
Iată câteva caracteristici cheie ale unui Pandas DataFrame:
- Reprezentarea datelor: Stochează datele într-un format de tabel cu rânduri și coloane.
- Tipuri de date eterogene: Poate deține diferite tipuri de date în coloane diferite (de exemplu, numere întregi, float, șiruri de caractere, boolean).
- Etichetare: Fiecare rând și coloană are o etichetă (nume de index și de coloană).
- Mutabil: Permite manipularea și modificarea datelor.
- Operații puternice: Oferă diverse funcții și metode pentru analiza, manipularea și explorarea datelor.
- Extensibil: Poate fi personalizat și extins cu funcționalități suplimentare prin biblioteci și funcții definite de utilizator.
Există mai multe moduri de a adăuga o nouă coloană la un DataFrame existent în Pandas în Piton :
- Crearea unui cadru de date eșantion
- Prin utilizarea Dataframe.insert() metodă
- Prin utilizarea Dataframe.assign() metodă
- Folosind Dicționar
- Folosind Listă
- Folosind .loc()
- Adăugarea mai multor coloane în cadrul de date existent
Crearea unui cadru de date eșantion
Aici creăm un exemplu de cadru de date:
Python3
import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> print>(df)> |
>
>
Ieșire:
Name Height Qualification 0 Jai 5.1 Msc 1 Princi 6.2 MA 2 Gaurav 5.1 Msc 3 Anuj 5.2 Msc>
Rețineți că lungimea listei dvs. ar trebui să se potrivească cu lungimea coloanei index, altfel va afișa o eroare.
Adăugați o coloană nouă la un Datframe existent folosind DataFrame.insert()
Oferă libertatea de a adăuga o coloană în orice poziție ne place și nu doar la sfârșit. De asemenea, oferă diferite opțiuni pentru inserarea valorilor coloanei.
Python3
import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using DataFrame.insert() to add a column> df.insert(>2>,>'Age'>, [>21>,>23>,>24>,>21>],>True>)> # Observe the result> print>(df)> |
>
>
Ieșire:
10 din 40
Name Height Age Qualification 0 Jai 5.1 21 Msc 1 Princi 6.2 23 MA 2 Gaurav 5.1 24 Msc 3 Anuj 5.2 21 Msc>
Adăugarea de coloane la Pandas DataFrame folosind Dataframe.assign()
Această metodă va crea un nou cadru de date cu o nouă coloană adăugată la vechiul cadru de date.
Python3
import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using 'Address' as the column name and equating it to the list> df2>=> df.assign(address>=>[>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>])> print>(df2)> |
>
>
Ieșire:
Name Height Qualification address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna>
Pandas Adăugați o coloană la DataFrame folosind un dicționar
Putem folosi a Dicționar Python pentru a adăuga o nouă coloană în Pandas DataFrame. Utilizați o coloană existentă ca valori cheie, iar valorile lor respective vor fi valorile pentru o nouă coloană.
Python3
# Import pandas package> import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Define a dictionary with key values of> # an existing column and their respective> # value pairs as the # values for our new column.> address>=> {>'Delhi'>:>'Jai'>,>'Bangalore'>:>'Princi'>,> >'Patna'>:>'Gaurav'>,>'Chennai'>:>'Anuj'>}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Provide 'Address' as the column name> df[>'Address'>]>=> address> # Observe the output> print>(df)> |
>
>
Ieșire:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna>
Adăugarea unei coloane noi la un Pandas DataFrame folosind Listă
În acest exemplu, Pandas adaugă coloane noi din listă Adresă unui Pandas DataFrame existent folosind un dicționar și o listă.
Python3
# Declare a list that is to be converted into a column> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Using 'Address' as the column name> # and equating it to the list> df[>'Address'>]>=> address> print>(df)> |
>
primul laptop
>
Ieșire:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna>
Adăugați o nouă coloană la un Pandas DataFrame existent folosind Dataframe.loc()
În acest exemplu, creează un Pandas DataFrame numitdf>cu coloanele Nume, Înălțime și Calificare și adaugă o nouă coloană Adresă folosindloc>atribut.
Python3
import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> # Create the list of new column values> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Add the new column using loc> df.loc[:,>'Address'>]>=> address> print>(df)> |
>
>
Ieșire:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna>
Adăugarea mai multor coloane în cadrul de date existent
În acest exemplu, extinde un Pandas DataFrame existentdf>cu două coloane noi, Age și State, folosind listele de date respective.
Python3
import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>],> >'Address'>: [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]}> df>=> pd.DataFrame(data)> # Define new data for additional columns> age>=> [>22>,>25>,>23>,>24>]> state>=> [>'NCT'>,>'Karnataka'>,>'Tamil Nadu'>,>'Bihar'>]> # Add multiple columns using dictionary assignment> new_data>=> {>'Age'>: age,>'State'>: state }> df>=> df.assign(>*>*>new_data)> print>(df)> |
>
>
Ieșire:
Name Height Qualification Address Age State 0 Jai 5.1 Msc Delhi 22 NCT 1 Princi 6.2 MA Bangalore 25 Karnataka 2 Gaurav 5.1 Msc Chennai 23 Tamil Nadu 3 Anuj 5.2 Msc Patna 24 Bihar>
Concluzie
Înțelegerea modului de adăugare a coloanelor noi la DataFrames este esențială pentru explorarea și manipularea datelor în Pandas. Alegerea metodei adecvate depinde de contextul specific și de rezultatul dorit. Prin stăpânirea acestor tehnici, puteți manipula, analiza și obține informații valoroase din datele dvs.