Filtrarea unui Pandas DataFrame prin valorile coloanelor este o operație obișnuită în timpul rulării cu informații în Python. Puteți utiliza diverse metode și tehnici pentru a realiza acest lucru. Iată numeroase moduri de a filtra un Pandas DataFrame prin valorile coloanei.
În această postare, vom vedea diferite moduri de a filtra Pandas Dataframe după valorile coloanei. Mai întâi, să creăm un cadru de date:
Python3
# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe :
'>, dataframe)> |
>
>
Ieșire:

Selectarea rândurilor de Pandas Dataframe pe baza unei anumite valori a coloanei folosind operatorul „>”, „=”, „=”, „<=”, „!=”.
Exemplul 1: Selectând toate rândurile din cadrul de date dat în care „Procentul” este mai mare de 75 folosind [ ] .
Python3
# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>>> > print>(>'
Result dataframe :
'>, rslt_df)> |
>
>
Ieșire:

Exemplul 2: Selectând toate rândurile din cadrul de date dat în care „Procentul” este mai mare de 70 folosind loc[ ] .
Python3
# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>>> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Ieșire:

Selectarea acelor rânduri de Pandas Dataframe a căror valoare de coloană este prezentă în listă folosind tu() metoda cadrului de date.
Exemplul 1: Selectând toate rândurile din cadrul de date dat în care „Stream” este prezent în lista de opțiuni folosind [ ] .
Python3
options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Ieșire:

Exemplul 2: Selectând toate rândurile din cadrul de date dat în care „Stream” este prezent în lista de opțiuni folosind loc[ ] .
Piton
options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Ieșire:

Selectarea rândurilor de Pandas Dataframe pe baza mai multor condiții de coloane folosind operatorul „&”.
Exemplul 1: Selectând toate rândurile din cadrul de date dat în care „Vârsta” este egală cu 22 și „Stream” este prezent în lista de opțiuni folosind [ ] .
Python3
options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Ieșire:

Exemplul 2: Selectând toate rândurile din cadrul de date dat în care „Vârsta” este egală cu 22 și „Stream” este prezent în lista de opțiuni folosind loc[ ] .
Python3
arhitectura cizme de primăvară
options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Ieșire:
