Pandas este capabil să combine obiecte Series, DataFrame și Panel prin diferite tipuri de logică setată pentru indici și funcționalitatea algebră relațională.
teoria arborilor și grafurilor
The concat() funcția este responsabilă pentru efectuarea operației de concatenare de-a lungul unei axe din DataFrame.
Sintaxă:
pd.concat(objs,axis=0,join='outer',join_axes=None, ignore_index=False)
Parametri:
Dacă trecem un dict în DataFrame, atunci cheile sortate vor fi folosite ca Keys argument, iar valorile vor fi selectate în acest caz. Dacă sunt prezente non-obiecte, atunci acesta va fi aruncat cu excepția cazului în care toate nu sunt niciunul și, în acest caz, un ValueError va fi ridicat.
Nu utilizează valorile indexului pe axa de concatenare, dacă este adevărat. Axa rezultată va fi etichetată ca 0, ..., n - 1.
Se intoarce
O serie este returnată atunci când concatenăm toate Seriile de-a lungul axei (axa=0). În cazul în care objs conține cel puțin un DataFrame, returnează un DataFrame.
Exemplul 1:
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data])
Ieșire
0 p 1 q 0 r 1 s dtype: object
Exemplul 2: În exemplul de mai sus, putem reseta indexul existent utilizând ignore_index parametru. Codul de mai jos demonstrează funcționarea ignore_index .
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], ignore_index=True)
Ieșire
0 p 1 q 2 r 3 s dtype: object
Exemplul 3: Putem adăuga un index ierarhic la nivelul cel mai exterior al datelor utilizând chei parametru.
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'])
Ieșire
panda se topește
a_data 0 p 1 q b_data 0 r 1 s dtype: object
Exemplul 4: Putem eticheta cheile de index folosind nume parametru. Codul de mai jos arată funcționarea parametrului nume.
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'], names=['Series name', 'Row ID'])
Ieșire
Series name Row ID a_data 0 p 1 q b_data 0 r 1 s dtype: object
Concatenare folosind append
Metoda append este definită ca o comandă rapidă utilă pentru a concatena seria și DataFrame.
Exemplu:
salvează gimp ca jpeg
import pandas as pd one = pd.DataFrame({ 'Name': ['Parker', 'Smith', 'Allen', 'John', 'Parker'], 'subject_id':['sub1','sub2','sub4','sub6','sub5'], 'Marks_scored':[98,90,87,69,78]}, index=[1,2,3,4,5]) two = pd.DataFrame({ 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5'], 'Marks_scored':[89,80,79,97,88]}, index=[1,2,3,4,5]) print (one.append(two))
Ieșire
Name subject_id Marks_scored 1 Parker sub1 98 2 Smith sub2 90 3 Allen sub4 87 4 John sub6 69 5 Parker sub5 78 1 Billy sub2 89 2 Brian sub4 80 3 Bran sub3 79 4 Bryce sub6 97 5 Betty sub5 88