Python - Pandas Kütüphanesi Eğitim Notları

PANDAS NEDİR?

Python'a Giriş konusu ile alakalı bilgileri, FreeCAD Eğitim Notları bölümünde 1. Python'a Giriş başlığı altında paylaşmıştık. Python'da yeniyseniz ya da Python hakkında hiç bir şey bilmiyorsanız, öncelikle bu bölüme göz atmanızı öneririm.

Önceki bölüme ilave olarak burada, Python'ın en güçlü ve işlevsel kütüphanelerinden biri olan Pandas notlarını paylaşmaya devam ediyorum.
Pandas Kütüphanesinin ne olduğu ve bu kütüphane ile (Özellikle Veri Çerçevesi (Data Frame) konusunda) neler yapılabildiğine dair öğrendiklerimi bu bölümde paylaşıyorum.
Pandas, veri işleme ve veri analizi için yazılmış olan Python kütüphanesidir.

Bu kütüphane, Seriler (Series) ve Veri Çerçevesi (DataFrame) isimli iki veri yapısının üzerine kurulmuştur. Serileri tek boyutlu diziler, Veri Çerçevelerini ise iki boyutlu matrisler (SQL ya da Excel tabloları) gibi düşünebiliriz.

Pandas kütüphanesinin özellikleri

  • İndeksli DataFrame (veri çerçevesi) objeleri ile veri işlemesi yapabilmek.
  • Hafızadaki veya farklı türlerde bulunan veriyi okuyabilmek ve yazabilmek için araçlar sağlamak.
  • Veri sıralama ve bütünleşik kayıp veri senaryolarına karşı esnek imkanlar sunmak
  • Veri setlerinin tekrar boyutlandırılması veya döndürülmesi.
  • Etiket bazlı dilimleme, özel indeksleme ve büyük veri setlerini ayrıştırmak
  • Veri çerçevesine sütun ekleme veya var olan sütunu çıkarma/silme.
  • Veri gruplama özelliği ile ayırma-birleştirme uygulamaları yapılabilmek.
  • Veri setlerini birleştirilmek ve birbirine eklemek.
  • Çok boyutlu veriden, daha az boyutlu veri elde edilebilmek.
  • Veri filtrelemek.

Kütüphane performans konusunda son derece iyidir. Bu yüzden kütüphanenin önemli parçaları CPython ve C üzerinde yazılmışlardır.

NOT:
Eğitimlerde kullandığım Veri Setlerine GitHub adresimden erişebilirsiniz.

Pandas Veri Çerçevesi (Data Frame) Konu Başlıkları

  1. Veri Çerçevesi (Data Frame) Oluştur
  2. Excel Dosyaları ile Çalışmak
  3. Veriyi Keşfet (İncele)
  4. Veri Seçim Yöntemleri
  5. Eksik - Kayıp Veri Yöntemleri
  6. Veri Düzenleme Yöntemleri
  7. Veri Sıralama Yöntemleri
  8. Veri Filtreleme Yöntemleri
  9. Gruplama Yöntemleri
  10. pivot_table() Fonksiyonunun Kullanımı
  11. melt() Fonksiyonunun Kullanımı

Pandas Veri Çerçevesi Özet Bilgileri (CheatSheet)

Pandas Veri Çerçevesi (Data Frame) komutlarını (fonksiyon, metot, parametre) bir yerde toplayarak ihtiyaç halinde, farklı konulara ait komutlara daha hızlı ulaşabileceğimiz bir Başvuru Kılavuzu / Özet Bilgi Tablosu (CheatSheet) oluşturmaya çalışıyorum. Başvuru kılavuzunu / Özet Bilgi Tablosunu (CheatSheet) oluştururken, komutları, Pandas Veri Çerçevesi (Data Frame) Konu Başlıklarına göre kategorize etmeyi planlıyorum.

Sayfaya Yeni Konu başlıkları ekledikçe, Özet Bilgi Tablosunu da güncellemeye gayret edeceğim.
Şuana kadar oluşturduğum Başvuru Kılavuzu / Özet Bilgi Tablosu (CheatSheet)na ağaşıdaki bağlantıdan erişebilirsiniz.

  • Pandas Özet Bilgi Tablosu (CheatSheet) Sayfası