logo

Countplot în Python

În acest articol, vom discuta despre cum putem crea un countplot utilizarea bibliotecii seaborn și modul în care diferiții parametri pot fi utilizați pentru a deduce rezultate din caracteristicile setului nostru de date.

Biblioteca Seaborn

Biblioteca seaborn este utilizată pe scară largă în rândul analiștilor de date, galaxia de diagrame pe care o conține oferă cea mai bună reprezentare posibilă a datelor noastre.

java se agită la int

Biblioteca seaborn poate fi importată în mediul nostru de lucru folosind-

 import seaborn as sns 

Să discutăm acum de ce folosim countplot și care este semnificația parametrilor săi.

Countplot

Countplot este utilizat pentru a reprezenta apariția (numărările) observației prezente în variabila categorială.

Utilizează conceptul de diagramă cu bare pentru reprezentarea vizuală.

Parametri-

Următorii parametri sunt specificați atunci când creăm un countplot, să ne facem o scurtă idee despre ei -

    x și y-Acest parametru specifică datele la care ne referim pentru reprezentare și apoi observă modelele evidențiate.culoare-Acest parametru specifică culoarea care poate da un aspect bun parcelei noastre.paletă-Ia valoarea paletei. Este folosit mai ales pentru a afișa variabila nuanță.nuanţă-Acest parametru specifică numele coloanei.date-Acest parametru specifică cadrul de date pe care dorim să-l luăm pentru reprezentare. De exemplu, datele pot fi o matrice.se eschiva-Acest parametru este unul opțional și acceptă o valoare booleană ca intrare.saturare-Acest parametru acceptă o valoare flotantă. O variație a intensității culorilor poate fi observată atunci când precizăm acest lucru.hue_order-Parametrul hue_order ia șiruri de caractere ca intrare.kwargs-Parametrul kwargs specifică mapările cheii și valorii.topor-Parametrul ax este unul opțional și este folosit pentru a lua axe pe care sunt create grafice.orienta-Parametrul orient este unul opțional și indică orientarea parcelei de care avem nevoie, orizontală sau verticală.

Acum să vedem care sunt diferitele moduri de a ne reprezenta atributele.

În primul exemplu, vom crea un countplot pentru o singură variabilă. Am luat „sfaturi” setului de date pentru a implementa același lucru.

1. Valoarea contează pentru o singură variabilă

Exemplu -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',data=df) plt.show() 

Ieșire:

Countplot în Python

În exemplul următor, vom folosi parametrul hue și vom crea un countplot.

Următorul program ilustrează același lucru-

în care an a fost inventat computerul

2. Reprezentarea a două variabile categoriale folosind parametrul hue

Exemplu -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',hue='smoker',data=df) plt.show() 

Ieșire:

Countplot în Python

În exemplul următor, vom lua în considerare axa y și vom crea un grafic de numărare orizontal.

fundal css

Următorul program ilustrează același lucru-

3. Crearea diagramelor orizontale

Exemplu -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(y='sex',hue='smoker',data=df) plt.show() 

Ieșire:

Countplot în Python

Să aruncăm acum o privire la modul în care paletele de culori pot îmbunătăți prezentarea datelor noastre.

În exemplul următor, vom folosi parametrul 'palette'.

Următorul program ilustrează același lucru-

4. Folosirea paletelor de culori

Intrare-

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex', data=df, palette='Set1') plt.show() 

Ieșire:

ssis
Countplot în Python

În exemplul următor, vom folosi parametrul culoare și vom vedea cum funcționează?

Următorul program ilustrează același lucru-

5. Utilizarea unui parametru „culoare”

Exemplu -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',hue='Sex', data=df, color='green') plt.show() 

Ieșire:

Countplot în Python

Acum vom folosi parametrul „saturație” și vom vedea cum afectează acesta reprezentarea datelor noastre.

Următorul program ilustrează același lucru-

6. Utilizarea parametrului „saturație”

Exemplu -

butonul central în css
 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',data=df, color='green', saturation=0.1) plt.show() 

Ieșire:

Countplot în Python

Și în sfârșit în ultimul exemplu vom folosi parametrii lățimea liniei și culoarea marginilor.

    Folosind matplotlib.axes.Axes.bar()

Exemplu -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') sns.countplot(x='Sex', data=df, color='green', facecolor=(0,0,0,0), linewidth=5, edgecolor=sns.color_palette('BrBG',2)) plt.show() 

Ieșire:

Countplot în Python