logo

Seria Python Pandas

Seria Pandas poate fi definită ca o matrice unidimensională care este capabilă să stocheze diferite tipuri de date. Putem converti cu ușurință lista, tuplul și dicționarul în serie folosind „ serie ' metoda. Etichetele de rând ale seriei se numesc index. O serie nu poate conține mai multe coloane. Are urmatorul parametru:

    date:Poate fi orice listă, dicționar sau valoare scalară.index:Valoarea indexului ar trebui să fie unică și hashable. Trebuie să aibă aceeași lungime cu datele. Dacă nu trecem niciun index, implicit np.arrange(n) va fi folosit.dtype:Se referă la tipul de date al seriei.copie:Este folosit pentru copierea datelor.

Crearea unei serii:

Putem crea o serie în două moduri:

  1. Creați o serie goală
  2. Creați o serie folosind intrări.

Creați o serie goală:

Putem crea cu ușurință o serie goală în Pandas, ceea ce înseamnă că nu va avea nicio valoare.

Sintaxa care este folosită pentru crearea unei serii goale:

 = pandas.Series() 

Exemplul de mai jos creează un obiect de tip Empty Series care nu are valori și care are tip de date implicit, adică float64 .

Exemplu

 import pandas as pd x = pd.Series() print (x) 

Ieșire

 Series([], dtype: float64) 

Crearea unei serii folosind intrări:

Putem crea Serii folosind diverse intrări:

  • Matrice
  • Dict
  • Valoare scalară

Crearea seriei din Array:

Înainte de a crea o serie, în primul rând, trebuie să importam numpy modul și apoi utilizați funcția array() în program. Dacă datele sunt ndarray, atunci indexul trecut trebuie să fie de aceeași lungime.

Dacă nu trecem un index, atunci implicit index of interval (n) este transmis unde n definește lungimea unui tablou, adică [0,1,2,.... interval (len (matrice))-1 ].

Exemplu

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Ieșire

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Creați o serie din dict

De asemenea, putem crea o serie din dict. Dacă obiectul dicționar este transmis ca intrare și indexul nu este specificat, atunci cheile dicționarului sunt luate într-o ordine sortată pentru a construi indexul .

Dacă indexul este trecut, atunci valorile corespund unei anumite etichete din index vor fi extrase din dicţionar .

cizmă de primăvară
 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Ieșire

 x 0.0 y 1.0 z 2.0 dtype: float64 

Creați o serie folosind scalar:

Dacă luăm valorile scalare, atunci indicele trebuie furnizat. Valoarea scalară va fi repetată pentru potrivirea lungimii indexului.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Ieșire

 0 4 1 4 2 4 3 4 dtype: int64 

Accesarea datelor din serii cu Poziție:

Odată ce creați obiectul de tip Series, puteți accesa indecșii, datele și chiar elementele individuale ale acestuia.

Datele din serie pot fi accesate similar cu cele din ndarray.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Ieșire

 1 

Atributele obiectului seriei

Atributul Series este definit ca orice informație legată de obiectul Series, cum ar fi dimensiunea, tipul de date. etc. Mai jos sunt câteva dintre atributele pe care le puteți utiliza pentru a obține informații despre obiectul Series:

Atribute Descriere
Seria.index Definește indexul Serii.
Seria.forma Returnează un tuplu de formă a datelor.
Seria.dtype Returnează tipul de date al datelor.
Seria.dimensiunea Returnează dimensiunea datelor.
Seria.gol Returnează True dacă obiectul Series este gol, în caz contrar returnează false.
Seria.hasnans Returnează True dacă există valori NaN, în caz contrar returnează false.
Serii.nbytes Returnează numărul de octeți din date.
Seria sunt Returnează numărul de dimensiuni din date.
Seria.dimensiunea articolului Returnează dimensiunea tipului de date al articolului.

Recuperarea matricei index și a matricei de date ale unui obiect serie

Putem prelua matricea de index și matricea de date a unui obiect Series existent utilizând indexul și valorile atributelor.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Ieșire

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Preluarea tipurilor (dtype) și dimensiunea tipului (itemsize)

Puteți utiliza atributul dtype cu obiect Series ca dtype pentru a prelua tipul de date al unui element individual al unui obiect serie, puteți utiliza dimensiunea articolelor atribut pentru a afișa numărul de octeți alocați fiecărui element de date.

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Ieșire

 int64 8 float64 8 

Recuperarea formei

Forma obiectului Series definește numărul total de elemente, inclusiv valorile lipsă sau goale (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Ieșire

 (4,) (3,) 

Preluarea dimensiunii, mărimii și numărului de octeți:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Ieșire

 1 1 4 3 32 24 

Verificarea golului și a prezenței NaN

Pentru a verifica că obiectul Series este gol, puteți utiliza atribut gol . În mod similar, pentru a verifica dacă un obiect în serie conține sau nu unele valori NaN, puteți utiliza hassan atribut.

Exemplu

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Ieșire

 False False True True False False 4 3 3 3 

Funcții de serie

Există câteva funcții utilizate în serie, care sunt după cum urmează:

Funcții Descriere
Pandas Series.map() Hartați valorile din două serii care au o coloană comună.
Pandas Series.std() Calculați abaterea standard a setului dat de numere, DataFrame, coloană și rânduri.
Pandas Series.to_frame() Convertiți obiectul serie în cadrul de date.
Pandas Series.value_counts() Returnează o serie care conține numărătoare de valori unice.