logo

Pandas DataFrame.describe()

Metoda describe() este folosită pentru calcularea unor date statistice, cum ar fi percentila, medie și std a valorilor numerice ale Series sau DataFrame. Analizează atât seriile numerice, cât și serii de obiecte, precum și seturile de coloane DataFrame de tipuri de date mixte.

Sintaxă

 DataFrame.describe(percentiles=None, include=None, exclude=None) 

Parametrii

    percentila:Este un parametru opțional, care este o listă ca tipul de date de numere care ar trebui să se încadreze între 0 și 1. Valoarea sa implicită este [.25, .5, .75], care returnează percentilele 25, 50 și 75.include:Este, de asemenea, un parametru opțional care include lista tipurilor de date în timp ce descrie DataFrame. Valoarea sa implicită este Niciuna.exclude:Este, de asemenea, un parametru opțional care exclude lista de tipuri de date în timp ce descrie DataFrame. Valoarea sa implicită este Niciuna.

Se intoarce

Returnează rezumatul statistic al seriei și cadrul de date.

Exemplul 1

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() 

Ieșire

 count 3.0 mean 2.0 std 1.0 min 1.0 25% 1.5 50% 2.0 75% 2.5 max 3.0 dtype: float64 

Exemplul 2

 import pandas as pd import numpy as np a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() 

Ieșire

 count 4 unique 3 top q freq 2 dtype: object 

Exemplul3

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) 

Ieșire

 categorical count 3 unique 3 top u freq 1 

Exemplul4

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe() info.describe(include='all') info.numeric.describe() info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) info.describe(exclude=[np.number]) info.describe(exclude=[np.object]) 

Ieșire

 categorical numeric count 3 3.0 unique 3 NaN top u NaN freq 1 NaN mean NaN 2.0 std NaN 1.0 min NaN 1.0 25% NaN 1.5 50% NaN 2.0 75% NaN 2.5 max NaN 3.0