logo

Concatenarea pandalor

Pandas este capabil să combine obiecte Series, DataFrame și Panel prin diferite tipuri de logică setată pentru indici și funcționalitatea algebră relațională.

teoria arborilor și grafurilor

The concat() funcția este responsabilă pentru efectuarea operației de concatenare de-a lungul unei axe din DataFrame.

Sintaxă:

 pd.concat(objs,axis=0,join='outer',join_axes=None, ignore_index=False) 

Parametri:

    objs:Este o secvență sau o mapare de obiecte serie sau DataFrame.
    Dacă trecem un dict în DataFrame, atunci cheile sortate vor fi folosite ca Keys argument, iar valorile vor fi selectate în acest caz. Dacă sunt prezente non-obiecte, atunci acesta va fi aruncat cu excepția cazului în care toate nu sunt niciunul și, în acest caz, un ValueError va fi ridicat.axă:Este o axă de concatenat.a te alatura:Responsabil pentru manipularea indicilor pe o altă axă.join_axes:O listă de obiecte index. În loc să efectueze logica setului interioară sau exterioară, se folosesc indecși specifici pentru cealaltă axă (n-1).ignore_index:bool, valoare implicită False
    Nu utilizează valorile indexului pe axa de concatenare, dacă este adevărat. Axa rezultată va fi etichetată ca 0, ..., n - 1.

Se intoarce

O serie este returnată atunci când concatenăm toate Seriile de-a lungul axei (axa=0). În cazul în care objs conține cel puțin un DataFrame, returnează un DataFrame.

Exemplul 1:

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data]) 

Ieșire

 0 p 1 q 0 r 1 s dtype: object 

Exemplul 2: În exemplul de mai sus, putem reseta indexul existent utilizând ignore_index parametru. Codul de mai jos demonstrează funcționarea ignore_index .

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], ignore_index=True) 

Ieșire

 0 p 1 q 2 r 3 s dtype: object 

Exemplul 3: Putem adăuga un index ierarhic la nivelul cel mai exterior al datelor utilizând chei parametru.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) 

Ieșire

panda se topește
 a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Exemplul 4: Putem eticheta cheile de index folosind nume parametru. Codul de mai jos arată funcționarea parametrului nume.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'], names=['Series name', 'Row ID']) 

Ieșire

 Series name Row ID a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Concatenare folosind append

Metoda append este definită ca o comandă rapidă utilă pentru a concatena seria și DataFrame.

Exemplu:

salvează gimp ca jpeg
 import pandas as pd one = pd.DataFrame({ 'Name': ['Parker', 'Smith', 'Allen', 'John', 'Parker'], 'subject_id':['sub1','sub2','sub4','sub6','sub5'], 'Marks_scored':[98,90,87,69,78]}, index=[1,2,3,4,5]) two = pd.DataFrame({ 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5'], 'Marks_scored':[89,80,79,97,88]}, index=[1,2,3,4,5]) print (one.append(two)) 

Ieșire

 Name subject_id Marks_scored 1 Parker sub1 98 2 Smith sub2 90 3 Allen sub4 87 4 John sub6 69 5 Parker sub5 78 1 Billy sub2 89 2 Brian sub4 80 3 Bran sub3 79 4 Bryce sub6 97 5 Betty sub5 88