Pandas - Büyüktür Operatörü

> (Büyüktür) Operatörü

Örnek Veri çerçevemiz aşağıda görünmektedir.

import pandas as pd
imdb = pd.read_excel("Veri_Setleri/imdb.xlsx", decimal=",")
print(imdb)
Film_Adı Yıl Puan Oylayan_Kişi
0 The Shawshank Redemption 1994 9.2 1071904
1 The Godfather 1972 9.2 751381
2 The Godfather: Part II 1974 9.0 488889
3 Pulp Fiction 1994 8.9 830504
4 The Dark Knight 2008 8.9 1045186
... ... ... ... ...
242 Mystic River 2003 7.9 256159
243 In the Heat of the Night 1967 7.9 37081
244 Arsenic and Old Lace 1944 7.9 45893
245 Before Sunrise 1995 7.9 100974
246 Papillon 1973 7.9 62517

247 rows × 4 columns

Karşılaştırma operatorlerini, Filtreleme işlemini dışında kıyaslama amacıyla da kullanabiliriz. Aşağıdaki kullanımı inceleyelim.

Mantiksal_imdb = imdb["Puan"] > 8
print(Mantiksal_imdb)
0       True
1       True
2       True
3       True
4       True
       ...  
242    False
243    False
244    False
245    False
246    False
Name: Puan, Length: 247, dtype: bool

Bu durumda, Puan sütunundaki değerler, verilen kritere göre (8'den büyük olup olmadığı) sorgulanıyor ve her değer için True (Doğru) yani değer 8'den büyük ya da False (yanlış) yani değer 8'e eşit ya da küçük sonucu döndürüyor.

Puan'ı 8'den büyük verileri tablo halinde görmek istersek aşağıdaki kodu kullanabiliriz.

print(imdb[imdb["Puan"] > 8])
Film_Adı Yıl Puan Oylayan_Kişi
239 Beauty and the Beast 1991 7.9 189229
240 Three Colors: Red 1994 7.9 43438
241 Bringing Up Baby 1938 7.9 35695
242 Mystic River 2003 7.9 256159
243 In the Heat of the Night 1967 7.9 37081
244 Arsenic and Old Lace 1944 7.9 45893
245 Before Sunrise 1995 7.9 100974
246 Papillon 1973 7.9 62517

Başka bir örnek yapalım. Öncelikle varolan tablolarımızda birini içe aktarıp veri çerçevesine dönüştürelim.

json = pd.read_json("Veri_Setleri/json_verisi.json")
print(json)
Duration Pulse Maxpulse Calories
0 60 110 130 409
1 60 117 145 479
2 60 103 135 340
3 45 109 175 282
4 45 117 148 406
5 60 102 127 300

Veri çerçevemizdeki her bir değerin 110'dan büyük olup olmadığını sorgulayalım.

print(json > 110)
Duration Pulse Maxpulse Calories
0 False False True True
1 False True True True
2 False False True True
3 False False True True
4 False True True True
5 False False True True

Gördüğünüz gibi, tablodaki tüm değerler, verilen kriter olan 110'dan büyük olup olmadığına göre sorgulandı ve cevabı her bir hücreye işlendi.

Sütunlarda, Değeri 110'dan büyük kaçar adet sayı olduğunu bulmak istersek sum() metodunu kullanmamız gerekir;

print((json > 110).sum())
Duration 0
Pulse 2
Maxpulse 6
Calories 6
dtype: int64

Veri çerçevemizde, 110'dan büyük toplam kaç adet sayı vardır, diye merak edersek;

print((json > 110).sum().sum())
14