Seria Pandas poate fi definită ca o matrice unidimensională care este capabilă să stocheze diferite tipuri de date. Putem converti cu ușurință lista, tuplul și dicționarul în serie folosind „ serie ' metoda. Etichetele de rând ale seriei se numesc index. O serie nu poate conține mai multe coloane. Are urmatorul parametru:
Crearea unei serii:
Putem crea o serie în două moduri:
- Creați o serie goală
- Creați o serie folosind intrări.
Creați o serie goală:
Putem crea cu ușurință o serie goală în Pandas, ceea ce înseamnă că nu va avea nicio valoare.
Sintaxa care este folosită pentru crearea unei serii goale:
= pandas.Series()
Exemplul de mai jos creează un obiect de tip Empty Series care nu are valori și care are tip de date implicit, adică float64 .
Exemplu
import pandas as pd x = pd.Series() print (x)
Ieșire
Series([], dtype: float64)
Crearea unei serii folosind intrări:
Putem crea Serii folosind diverse intrări:
- Matrice
- Dict
- Valoare scalară
Crearea seriei din Array:
Înainte de a crea o serie, în primul rând, trebuie să importam numpy modul și apoi utilizați funcția array() în program. Dacă datele sunt ndarray, atunci indexul trecut trebuie să fie de aceeași lungime.
Dacă nu trecem un index, atunci implicit index of interval (n) este transmis unde n definește lungimea unui tablou, adică [0,1,2,.... interval (len (matrice))-1 ].
Exemplu
import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a)
Ieșire
0 P 1 a 2 n 3 d 4 a 5 s dtype: object
Creați o serie din dict
De asemenea, putem crea o serie din dict. Dacă obiectul dicționar este transmis ca intrare și indexul nu este specificat, atunci cheile dicționarului sunt luate într-o ordine sortată pentru a construi indexul .
Dacă indexul este trecut, atunci valorile corespund unei anumite etichete din index vor fi extrase din dicţionar .
cizmă de primăvară
#import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a)
Ieșire
x 0.0 y 1.0 z 2.0 dtype: float64
Creați o serie folosind scalar:
Dacă luăm valorile scalare, atunci indicele trebuie furnizat. Valoarea scalară va fi repetată pentru potrivirea lungimii indexului.
#import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x)
Ieșire
0 4 1 4 2 4 3 4 dtype: int64
Accesarea datelor din serii cu Poziție:
Odată ce creați obiectul de tip Series, puteți accesa indecșii, datele și chiar elementele individuale ale acestuia.
Datele din serie pot fi accesate similar cu cele din ndarray.
import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0])
Ieșire
1
Atributele obiectului seriei
Atributul Series este definit ca orice informație legată de obiectul Series, cum ar fi dimensiunea, tipul de date. etc. Mai jos sunt câteva dintre atributele pe care le puteți utiliza pentru a obține informații despre obiectul Series:
Atribute | Descriere |
---|---|
Seria.index | Definește indexul Serii. |
Seria.forma | Returnează un tuplu de formă a datelor. |
Seria.dtype | Returnează tipul de date al datelor. |
Seria.dimensiunea | Returnează dimensiunea datelor. |
Seria.gol | Returnează True dacă obiectul Series este gol, în caz contrar returnează false. |
Seria.hasnans | Returnează True dacă există valori NaN, în caz contrar returnează false. |
Serii.nbytes | Returnează numărul de octeți din date. |
Seria sunt | Returnează numărul de dimensiuni din date. |
Seria.dimensiunea articolului | Returnează dimensiunea tipului de date al articolului. |
Recuperarea matricei index și a matricei de date ale unui obiect serie
Putem prelua matricea de index și matricea de date a unui obiect Series existent utilizând indexul și valorile atributelor.
import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values)
Ieșire
RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5]
Preluarea tipurilor (dtype) și dimensiunea tipului (itemsize)
Puteți utiliza atributul dtype cu obiect Series ca dtype pentru a prelua tipul de date al unui element individual al unui obiect serie, puteți utiliza dimensiunea articolelor atribut pentru a afișa numărul de octeți alocați fiecărui element de date.
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize)
Ieșire
int64 8 float64 8
Recuperarea formei
Forma obiectului Series definește numărul total de elemente, inclusiv valorile lipsă sau goale (NaN).
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape)
Ieșire
(4,) (3,)
Preluarea dimensiunii, mărimii și numărului de octeți:
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes)
Ieșire
1 1 4 3 32 24
Verificarea golului și a prezenței NaN
Pentru a verifica că obiectul Series este gol, puteți utiliza atribut gol . În mod similar, pentru a verifica dacă un obiect în serie conține sau nu unele valori NaN, puteți utiliza hassan atribut.
Exemplu
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( ))
Ieșire
False False True True False False 4 3 3 3
Funcții de serie
Există câteva funcții utilizate în serie, care sunt după cum urmează:
Funcții | Descriere |
---|---|
Pandas Series.map() | Hartați valorile din două serii care au o coloană comună. |
Pandas Series.std() | Calculați abaterea standard a setului dat de numere, DataFrame, coloană și rânduri. |
Pandas Series.to_frame() | Convertiți obiectul serie în cadrul de date. |
Pandas Series.value_counts() | Returnează o serie care conține numărătoare de valori unice. |