Pandas - ya da operatörü

| (ya da) Operatörü

İki farklı kriterin de geçerli olduğu verileri filtrelemek istediğimizde YA DA (or) simgesi olan | karakteri kullanılır. | karakteri yerine or kelimesi kullanırsanız hata alırsınız.

Örnek Veri çerçevemiz aşağıda görünmektedir.

import pandas as pd
imdb = pd.read_excel("Veri_Setleri/imdb.xlsx", decimal=",")
print(imdb)
Film_Adı Yıl Puan Oylayan_Kişi
0 The Shawshank Redemption 1994 9.2 1071904
1 The Godfather 1972 9.2 751381
2 The Godfather: Part II 1974 9.0 488889
3 Pulp Fiction 1994 8.9 830504
4 The Dark Knight 2008 8.9 1045186
... ... ... ... ...
242 Mystic River 2003 7.9 256159
243 In the Heat of the Night 1967 7.9 37081
244 Arsenic and Old Lace 1944 7.9 45893
245 Before Sunrise 1995 7.9 100974
246 Papillon 1973 7.9 62517

247 rows × 4 columns

Yıl sütunundaki değerin 2.000'den büyük ya da Oylayan_Kişi sütunundaki değerin de 500.000'den büyük olduğu verileri filtrelemek istersek aşağıdaki kodları kullanabiliriz.

yıl_2000den_buyuk = imdb["Yıl"] > 2000
Oylayan_Kişi_500000 = imdb["Oylayan_Kişi"] > 500000

print(imdb[yıl_2000den_buyuk | Oylayan_Kişi_500000])
Film_Adı Yıl Puan Oylayan_Kişi
0 The Shawshank Redemption 1994 9.2 1071904
1 The Godfather 1972 9.2 751381
3 Pulp Fiction 1994 8.9 830504
4 The Dark Knight 2008 8.9 1045186
6 Schindler's List 1993 8.9 545703
... ... ... ... ...
231 Shutter Island 2010 8.0 436151
233 Incendies 2010 8.0 36751
236 3 Idiots 2009 8.0 83178
237 The Artist 2011 8.0 132672
242 Mystic River 2003 7.9 256159

81 rows × 4 columns