logo

Diferite moduri de a crea Pandas Dataframe

Pandas DataFrame este o structură de date bidimensională etichetată ca un tabel cu rânduri și coloane. Dimensiunea și valorile DataFrame sunt modificabile, adică pot fi modificate.

DataFrame este folosit mai ales în analiza și manipularea datelor. Vă permite să stocați date în formă tabelară, cum ar fi baza de date SQL, MS Excel sau Google Sheets, facilitând efectuarea de operații aritmetice asupra datelor.



Este cel mai des folosit obiect Pandas. The Funcția DataFrame(). este folosit pentru a crea un DataFrame în Pandas. De asemenea, puteți crea Pandas DataFrame în mai multe moduri.

Sintaxa Pandas Dataframe().

pandas.DataFrame(date, index, coloane)

alinierea unei imagini în css

Parametri:

  • date : Este un set de date din care urmează să fie creat un DataFrame. Poate fi o listă, dicționar, valoare scalară, serie și matrice etc.
  • index : Este opțional, implicit indexul DataFrame-ului începe de la 0 și se termină la ultima valoare a datelor (n-1). Definește în mod explicit eticheta rândului.
  • coloane : Acest parametru este utilizat pentru a furniza nume de coloane în DataFrame. Dacă numele coloanei nu este definit implicit, va lua o valoare de la 0 la n-1.

Se intoarce:

  • obiect DataFrame

Acum că am discutat despre funcția DataFrame(), să ne uităm la diferite moduri de a crea un DataFrame:



Diferite moduri de a crea un cadru de date în Python

Există mai multe moduri de a crea un Pandas Dataframe în Piton . Puteți crea un DataFrame cu următoarele metode:

  • Creați Pandas DataFrame folosind funcția DataFrame().
  • Creați Pandas DataFrame din lista de liste
  • Creați Pandas DataFrame din dicționarul ndarray/list
  • Creați Pandas DataFrame din lista de dicționare
  • Creați Pandas DataFrame dintr-un dicționar de serie
  • Crearea DataFrame folosind funcția zip().
  • Crearea unui DataFrame prin demonstrarea explicit a etichetei indexului

Creați un DataFrame gol folosind metoda DataFrame().

DataFrame în Python poate fi creat de funcția DataFrame() a Biblioteca panda . Doar apelați funcția cu constructorul DataFrame pentru a crea un DataFrame.

Exemplu : Crearea unui DataFrame gol folosind funcția DataFrame() în Python



Python3




# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df>=> pd.DataFrame()> # Printing Empty DataFrame> print>(df)>

>

>

Ieșire:

Empty DataFrame Columns: [] Index: []>

Creați DataFrame din liste de liste

Pentru a crea un Pandas DataFrame dintr-un listă de liste, puteți utiliza funcția pd.DataFrame(). Această funcție preia o listă de liste ca intrare și creează un DataFrame cu același număr de rânduri și coloane ca și lista de intrare.

Exemplu : Crearea DataFrame din liste de liste folosind metoda DataFrame().

Python3




# Import pandas library> import> pandas as pd> # initialize list of lists> data>=> [[>'tom'>,>10>], [>'nick'>,>15>], [>'juli'>,>14>]]> # Create the pandas DataFrame> df>=> pd.DataFrame(data, columns>=>[>'Name'>,>'Age'>])> # print dataframe.> print>(df)>

>

>

Ieșire:

 Name Age 0 tom 10 1 nick 15 2 juli 14>

Creați DataFrame din Dicționarul ndArray/Liste

Pentru a crea DataFrame dintr-un dicţionar de ndarrays /lists, toate tablourile trebuie să aibă aceeași lungime. Dacă este trecut un index, atunci indicele de lungime ar trebui să fie egal cu lungimea matricelor.

Dacă nu este trecut niciun index, atunci implicit, indexul va fi range(n) unde n este lungimea matricei.

Exemplu : Crearea DataFrame dintr-un dicționar de ndarray/liste

Python3




polimorfism

# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data>=> {>'Name'>: [>'Tom'>,>'nick'>,>'krish'>,>'jack'>],> >'Age'>: [>20>,>21>,>19>,>18>]}> # Create DataFrame> df>=> pd.DataFrame(data)> # Print the output.> print>(df)>

>

>

Ieșire:

 Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>

Notă: În timp ce creați DataFrame folosind un dicționar, cheile dicționarului vor fi nume de coloane în mod implicit. De asemenea, putem furniza nume de coloane în mod explicit folosind parametrul de coloană.

Creați DataFrame din Lista de dicționare

Pandas DataFrame poate fi creat prin trecere liste de dicționare ca date de intrare. În mod implicit, cheile de dicționar vor fi luate ca coloane.

Python3




conversie int în șir în java

# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data>=> [{>'a'>:>1>,>'b'>:>2>,>'c'>:>3>},> >{>'a'>:>10>,>'b'>:>20>,>'c'>:>30>}]> # Creates DataFrame.> df>=> pd.DataFrame(data)> # Print the data> print>(df)>

>

>

Ieșire:

a b c 0 1 2 3 1 10 20 30>

Un alt exemplu este crearea unui Pandas DataFrame prin trecerea listelor de dicționare și indici de rând .

Python3




# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data>=> [{>'b'>:>2>,>'c'>:>3>}, {>'a'>:>10>,>'b'>:>20>,>'c'>:>30>}]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df>=> pd.DataFrame(data, index>=>[>'first'>,>'second'>])> # Print the data> print>(df)>

>

>

Ieșire:

b c a first 2 3 NaN second 20 30 10.0>

Creați DataFrame dintr-un dicționar de serie

Pentru a crea un DataFrame dintr-un dicționar de serie , un dicționar poate fi transmis pentru a forma un DataFrame. Indicele rezultat este uniunea tuturor serii de indexați trecuți.

Exemplu: Crearea unui DataFrame dintr-un dicționar de serii.

Python3


convertiți șirul în json java



# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d>=> {>'one'>: pd.Series([>10>,>20>,>30>,>40>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>]),> >'two'>: pd.Series([>10>,>20>,>30>,>40>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>])}> # creates Dataframe.> df>=> pd.DataFrame(d)> # print the data.> print>(df)>

>

>

Ieșire:

 one two a 10 10 b 20 20 c 30 30 d 40 40>

Creați DataFrame folosind funcția zip().

Două liste pot fi îmbinate utilizând funcția zip(). . Acum, creați Pandas DataFrame apelând funcția pd.DataFrame().

Exemplu: Crearea DataFrame folosind funcția zip().

Python3




mit forma completa

# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name>=> [>'tom'>,>'krish'>,>'nick'>,>'juli'>]> # List2> Age>=> [>25>,>30>,>26>,>22>]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples>=> list>(>zip>(Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df>=> pd.DataFrame(list_of_tuples,> >columns>=>[>'Name'>,>'Age'>])> # Print data.> print>(df)>

>

>

Ieșire:

 Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>

Creați un DataFrame demonstrând în mod explicit eticheta indexului

Pentru a crea un DataFrame prin furnizarea explicit a etichetei indexului, puteți utiliza parametrul index al constructorului pd.DataFrame(). Parametrul index ia o listă de etichete de index ca intrare, iar DataFrame va folosi aceste etichete pentru rândurile DataFrame.

Exemplu: Crearea unui DataFrame prin demonstrarea explicit a etichetei indexului

Python3




# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data>=> {>'Name'>: [>'Tom'>,>'Jack'>,>'nick'>,>'juli'>],> >'marks'>: [>99>,>98>,>95>,>90>]}> # Creates pandas DataFrame.> df>=> pd.DataFrame(data, index>=>[>'rank1'>,> >'rank2'>,> >'rank3'>,> >'rank4'>])> # print the data> print>(df)>

>

>

Ieșire:

 Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>

Concluzie

Python Pandas DataFrame este similar cu un tabel cu rânduri și coloane. Este o structură de date bidimensională și este foarte utilă pentru analiza și manipularea datelor.

În acest tutorial, am discutat mai multe moduri de a crea un Pandas DataFrame. Cu acest tutorial, veți putea face față oricărei cerințe complexe de a crea DataFrame.