Funcția unique() elimină toate valorile duplicate dintr-o coloană și returnează o singură valoare pentru mai multe aceleași valori. În acest articol, vom discuta despre cum putem obține valori unice dintr-o coloană în Pandas DataFrame .
Crearea unui cadru de date Pandas cu elemente duplicate
Creați un exemplu de cadru de date Pandas cu un dicționar de liste, să spunem că numele coloanelor sunt A, B, C, D și E cu elemente duplicat.
Python3
# Import pandas package> import> pandas as pd> # create a dictionary with five fields each> data>=> {> >'A'>: [>'A1'>,>'A2'>,>'A3'>,>'A4'>,>'A5'>],> >'B'>: [>'B1'>,>'B2'>,>'B3'>,>'B4'>,>'B4'>],> >'C'>: [>'C1'>,>'C2'>,>'C3'>,>'C3'>,>'C3'>],> >'D'>: [>'D1'>,>'D2'>,>'D2'>,>'D2'>,>'D2'>],> >'E'>: [>'E1'>,>'E1'>,>'E1'>,>'E1'>,>'E1'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> |
>
>

Obțineți valori unice dintr-o coloană din Pandas DataFrame
Mai jos sunt câteva exemple prin care putem obține valorile unice ale unei coloane din acest cadru de date.
- Obțineți valorile unice ale coloanei „B”.
- Obțineți valorile unice ale coloanei „E”.
- Obțineți numărul de valori unice într-o coloană
- Folosind set() pentru a elimina valorile duplicate dintr-o coloană
- Folosind metodele pandas.concat() și Unique().
- Folosind Series.drop_duplicates()
Obțineți valorile unice ale coloanei „B”.
În acest exemplu, recuperăm și tipărim valorile unice din coloana „B” folosind unique()> metodă. Valorile unice rezultate sunt['B1', 'B2', 'B3', 'B4']>.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'B' column> df.B.unique()> |
>
>
Ieșire
array(['B1', 'B2', 'B3', 'B4'], dtype=object)>
Obțineți valorile unice ale pandalor în coloana „E”.
În acest exemplu, creăm un Pandas DataFrame dintr-un dicționar și apoi extragem valorile unice din coloana „E” folosindunique()>metodă. Valorile unice rezultate sunt['E1']>.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'E' column> df.E.unique()> |
componentele robotului
>
>
Ieșire
array(['E1'], dtype=object)>
Obțineți numărul de valori unice într-o coloană
În acest exemplu, creăm un panda DataFrame dintr-un dicționar și apoi calculăm și tipărim numărul de valori unice din coloana „C”, excluzând valorile NaN. Rezultatul este 3, indicând că există trei valori unice în coloana „C”.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get number of unique values in column 'C'> df.C.nunique(dropna>=>True>)> |
>
>
Ieșire
cate orase este in Statele Unite
3>
Eliminați valorile duplicate dintr-o coloană folosind set()
În acest exemplu, creăm un panda DataFrame dintr-un dicționar și apoi folosim set()>funcţie pentru a extrage valori unice din coloana „C”, eliminând duplicatele. Setul rezultat,{'C1', 'C2', 'C3'}>, reprezintă valorile unice din coloana „C”.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use set() to eliminate duplicate values in column 'C'> unique_values_set>=> set>(df[>'C'>])> # Print the unique values> print>(unique_values_set)> |
>
>
Ieșire
{'C1', 'C2', 'C3'}> Folosind metodele pandas.concat() și Unique().
În acest exemplu, creăm un Pandas DataFrame dintr-un dicționar și apoi concatenăm valori unice din toate coloanele folosind pd.concat()> . Matricea NumPy rezultată, atunci când este tipărită, afișează toate valorile unice de la coloanele „A” la „E”.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use pd.concat() to concatenate all columns and then apply unique()> unique_values_all_columns>=> pd.concat([df[col].unique()>for> col>in> df.columns])> # Print the unique values> print>(unique_values_all_columns)> |
>
>
Ieșire
['A1' 'A2' 'A3' 'A4' 'A5' 'B1' 'B2' 'B3' 'B4' 'C1' 'C2' 'C3' 'D1' 'D2' 'E1']>
Folosind Series.drop_duplicates()
În acest exemplu, creăm un panda DataFrame dintr-un dicționar și eliminăm duplicatele din coloanele „A” și „D” folosind drop_duplicates()>metodă . DataFrame rezultat, atunci când este tipărit, afișează valorile unice în coloanele „A” și „D”, cu valori NaN în care duplicatele au fost eliminate din „D”.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use drop_duplicates() to remove duplicates from columns 'A' and 'D'> df[>'A'>]>=> df[>'A'>].drop_duplicates()> df[>'D'>]>=> df[>'D'>].drop_duplicates()> # Print the DataFrame after removing duplicates from columns 'A' and 'D'> print>(df)> |
>
>
Ieșire
A B C D E 0 A1 B1 C1 D1 E1 1 A2 B2 C2 D2 E1 2 A3 B3 C3 NaN E1 3 A4 B4 C3 NaN E1 4 A5 B4 C3 NaN E1>