Pandas - ya da operatörü
Cts 16 Temmuz 2022| (ya da) Operatörü
İki farklı kriterin de geçerli olduğu verileri filtrelemek istediğimizde YA DA (or) simgesi olan | karakteri kullanılır. | karakteri yerine or kelimesi kullanırsanız hata alırsınız.
Örnek Veri çerçevemiz aşağıda görünmektedir.
import pandas as pd
imdb = pd.read_excel("Veri_Setleri/imdb.xlsx", decimal=",")
print(imdb)
Film_Adı | Yıl | Puan | Oylayan_Kişi | |
---|---|---|---|---|
0 | The Shawshank Redemption | 1994 | 9.2 | 1071904 |
1 | The Godfather | 1972 | 9.2 | 751381 |
2 | The Godfather: Part II | 1974 | 9.0 | 488889 |
3 | Pulp Fiction | 1994 | 8.9 | 830504 |
4 | The Dark Knight | 2008 | 8.9 | 1045186 |
... | ... | ... | ... | ... |
242 | Mystic River | 2003 | 7.9 | 256159 |
243 | In the Heat of the Night | 1967 | 7.9 | 37081 |
244 | Arsenic and Old Lace | 1944 | 7.9 | 45893 |
245 | Before Sunrise | 1995 | 7.9 | 100974 |
246 | Papillon | 1973 | 7.9 | 62517 |
247 rows × 4 columns
Yıl sütunundaki değerin 2.000'den büyük ya da Oylayan_Kişi sütunundaki değerin de 500.000'den büyük olduğu verileri filtrelemek istersek aşağıdaki kodları kullanabiliriz.
yıl_2000den_buyuk = imdb["Yıl"] > 2000
Oylayan_Kişi_500000 = imdb["Oylayan_Kişi"] > 500000
print(imdb[yıl_2000den_buyuk | Oylayan_Kişi_500000])
Film_Adı | Yıl | Puan | Oylayan_Kişi | |
---|---|---|---|---|
0 | The Shawshank Redemption | 1994 | 9.2 | 1071904 |
1 | The Godfather | 1972 | 9.2 | 751381 |
3 | Pulp Fiction | 1994 | 8.9 | 830504 |
4 | The Dark Knight | 2008 | 8.9 | 1045186 |
6 | Schindler's List | 1993 | 8.9 | 545703 |
... | ... | ... | ... | ... |
231 | Shutter Island | 2010 | 8.0 | 436151 |
233 | Incendies | 2010 | 8.0 | 36751 |
236 | 3 Idiots | 2009 | 8.0 | 83178 |
237 | The Artist | 2011 | 8.0 | 132672 |
242 | Mystic River | 2003 | 7.9 | 256159 |
81 rows × 4 columns