Pandas - resample

resample() Metodu

resample() Metodu, zaman serisi verilerinin frekansını dönüştürmek ve yeniden örneklemek için kullanılan temel bir metottur.

resample

Sözdizimi:

resample() fonksiyonunun sözdizimi aşağıdaki gibidir. Parametrelerin açıklaması aşağıda Parametreler başlığında bulabilirsiniz.

DataFrame.resample(rule, axis=<no_default>, closed=None, label=None, 
                    convention='start', kind=<no_default>, on=None, 
                    level=None, origin='start_day', offset=None …

Continue reading »

Pandas - assign Metodu

assign() Metodu

assign() metodu, bir veri tablosu üzerinde çalışırken, tablonun orijinal halini bozmadan (değiştirilmezlik ilkesi) yeni bir sütun eklemek istediğinizde kullanılır.

Eğer elinizde bir satış tablosu varsa ve siz bu tabloya "Toplam Gelir" diye bir sütun eklemek istiyorsanız, assign() metodu ile bu yeni sütunu hesaplayıp ekleyebilirsiniz. Sonuç olarak, hem eski …

Continue reading »

Pandas - pyarrow

pyarrow String Türü ile Hızlanmak

Pandas'ta dizelerle (strings) mi çalışıyorsunuz ve beklediğinizden biraz daha yavaş olduğunu mu görüyorsunuz? Bu eğitimde, PyArrow'u kullanarak işleri nasıl hızlandırabileceğimizi öğreneceğiz.

Örnek olarak kullanacağımız dosyanın adı TDK_imla.txt. Bu dosya, satır başına bir kelime olacak şekilde toplam 76.183 kelime içeren bir imla sözlüğüdür …

Continue reading »

Pandas - unique ve nunique

unique() ve nunique() Metotları

unique() Metodu

unique() Metodu, Veri Çerçevesinden benzersiz değerler tespit etmek, kategorik verileri analiz etmek veya yinelenen verileri tanımlamak için kullanılır.

unique_nunique

unique() Metodunun Kullanımı

unique() Fonksiyonu bir NumPy dizisi döndürür. Bir sütundaki benzersiz (farklı) değerleri tanımlamak için kullanışlıdır ve bu, kategorik verilerle çalışırken veya benzersiz değerleri algılarken …

Continue reading »

Pandas - value_counts

value_counts() Metodu

Veri çerçevemizde sütun bazında verinin kaç kez tekrar ettiğini (kaç adet bulunduğunu) öğrenmek için value_counts() metodunu kullanabiliriz. value_counts metodu, veri frekansını (sıklığını) içeren bir Seri döndürün. Excel ve Libre Ofis Calc uygulamalarındaki Yinelenenleri Kaldır (Remove Duplicates) komutuna benzer bir işlev ile sütundaki benzersiz tüm değerleri içeren bir seri …

Continue reading »

Pandas - Bölme Operatörü

/ (Bölme) Operatörü

İki sütun verisini / bölme operatörü ile bölebiliriz.

baslik = ["Birler", "Onlar", "Yüzler"]
basliksiz = pd.read_excel("Veri_Setleri/basliksiz.ods", header = None, names = baslik )
print(basliksiz)
Birler Onlar Yüzler
0 9 82 246
1 7 78 180
2 8 83 565
3 6 82 486
4 4 37 615
5 2 …

Continue reading »

Pandas - Çarpma Operatörü

* (Çarpma) Operatörü

İki sütun verisini * çarpma operatörü ile çarpabiliriz.

baslik = ["Birler", "Onlar", "Yüzler"]
basliksiz = pd.read_excel("Veri_Setleri/basliksiz.ods", header = None, names = baslik )
print(basliksiz)
Birler Onlar Yüzler
0 9 82 246
1 7 78 180
2 8 83 565
3 6 82 486
4 4 37 615
5 2 …

Continue reading »

Pandas - Çıkarma Operatörü

- (Çıkarma) Operatörü

İki sütun verisini - çıkarma operatörü ile çıkarabiliriz, farkını alabiliriz.

baslik = ["Birler", "Onlar", "Yüzler"]
basliksiz = pd.read_excel("Veri_Setleri/basliksiz.ods", header = None, names = baslik )
print(basliksiz)
Birler Onlar Yüzler
0 9 82 246
1 7 78 180
2 8 83 565
3 6 82 486
4 4 37 615 …

Continue reading »

Pandas - mean

mean() Metodu

Her sütun için ortalama değer hesaplamak için mean() metodunu kullanabiliriz.

baslik = ["Birler", "Onlar", "Yüzler"]
basliksiz = pd.read_excel("Veri_Setleri/basliksiz.ods", header = None, names = baslik )
print(basliksiz)
Birler Onlar Yüzler
0 9 82 246
1 7 78 180
2 8 83 565
3 6 82 486
4 4 37 …

Continue reading »

Pandas - sum operatörü

sum() Metodu

Python'dan toplam değeri bulmak için kullanmaya aşina olduğumuz sum() fonksiyonu, Pandas içerisinde metot olarak bulunuyor. Yani Python'da sum() fonksiyonuna parametre olarak bir değişken veriyorduk. (Ör. sum(liste)). Pandasta ise veri çerçevesi adının sonuna metot olarak ekliyoruz. (Ör. VeriCercevesi.sum())

Örneklerle inceleyelim.

baslik = ["Birler", "Onlar", "Yüzler"]
basliksiz = pd.read_excel …

Continue reading »