Pandas - Giriş
Cts 09 Temmuz 2022Pandas Kütüphanesi Notları
Python'a Giriş konusuna ait notları, FreeCAD için Python ile Komut Dosyası Oluşturma (Scripting) Eğitiminde paylaşmıştık. İlave olarak Python'ın en güçlü ve işlevsel kütüphanelerinden biri olan Pandas'a ait notları paylaşmaya devam ediyorum.
PANDAS NEDİR?
Python'a Giriş konusu ile alakalı bilgileri, FreeCAD Eğitim Notları bölümünde 1. Python'a Giriş başlığı altında paylaşmıştık. Python'da yeniyseniz ya da Python hakkında hiç bir şey bilmiyorsanız, öncelikle bu bölüme göz atmanızı öneririm.
Önceki bölüme ilave olarak burada, Python'ın en güçlü ve işlevsel kütüphanelerinden biri olan Pandas notlarını paylaşmaya devam ediyorum.
Pandas Kütüphanesinin ne olduğu ve bu kütüphane ile (Özellikle Veri Çerçevesi (Data Frame) konusunda) neler yapılabildiğine dair öğrendiklerimi bu bölümde paylaşıyorum.
Pandas, veri işleme ve veri analizi için yazılmış olan Python kütüphanesidir.
Bu kütüphane, Seriler (Series) ve Veri Çerçevesi (DataFrame) isimli iki veri yapısının üzerine kurulmuştur. Serileri tek boyutlu diziler, Veri Çerçevelerini ise iki boyutlu matrisler (SQL ya da Excel tabloları) gibi düşünebiliriz.
Pandas kütüphanesinin özellikleri
- İndeksli DataFrame (veri çerçevesi) objeleri ile veri işlemesi yapabilmek.
- Hafızadaki veya farklı türlerde bulunan veriyi okuyabilmek ve yazabilmek için araçlar sağlamak.
- Veri sıralama ve bütünleşik kayıp veri senaryolarına karşı esnek imkanlar sunmak
- Veri setlerinin tekrar boyutlandırılması veya döndürülmesi.
- Etiket bazlı dilimleme, özel indeksleme ve büyük veri setlerini ayrıştırmak
- Veri çerçevesine sütun ekleme veya var olan sütunu çıkarma/silme.
- Veri gruplama özelliği ile ayırma-birleştirme uygulamaları yapılabilmek.
- Veri setlerini birleştirilmek ve birbirine eklemek.
- Çok boyutlu veriden, daha az boyutlu veri elde edilebilmek.
- Veri filtrelemek.
Kütüphane performans konusunda son derece iyidir. Bu yüzden kütüphanenin önemli parçaları CPython ve C üzerinde yazılmışlardır.
NOT:
Eğitimlerde kullandığım Veri Setlerine GitHub adresimden erişebilirsiniz.
Pandas Veri Çerçevesi (Data Frame) Konu Başlıkları
1- VERİ ÇERÇEVESİ (DATA FRAME) OLUŞTUR
DataFrame() Fonksiyonu
read_csv() Fonksiyonu
... index_col Parametresi
read_table() Fonksiyonu
... delimiter Parametresi
read_excel() Fonksiyonu
read_json() Fonksiyonu
read_html() Fonksiyonu
read_clipboard() Fonksiyonu
2- EXCEL DOSYALARI İLE ÇALIŞMAK
read_excel() Fonksiyonu
... header ve names Parametreleri
... sheet_name Parametresi
... decimal Parametresi
head() Fonksiyonu
tail() Fonksiyonu
columns Fonksiyonu
len() Fonksiyonu
info() Fonksiyonu
dtypes Fonksiyonu
describe() Fonksiyonu
shape Fonksiyonu
index Fonksiyonu
isnull() Fonksiyonu
value_counts() Fonksiyonu
iloc[] Metodu
loc[] Metodu
Index() Fonksiyonu
lambda() Fonksiyonu
at[] metodu
iat[] metodu
5- EKSİK - KAYIP VERİ YÖNTEMLERİ
isnull() Fonksiyonu
dropna() Fonksiyonu
... axis Parametresi
... inplace Parametresi
... thresh Parametresi
fillna() Fonksiyonu
... value Parametresi
... ~method Parametresi~
ffill() Fonksiyonu
bfill() Fonksiyonu
İndeks Değerlerini Ayarlamak
... index_col Parametresi
set_index() Fonksiyonu
Sütunları Atla
... usecols Parametresi
Satırları Atla
... skiprows Parametresi
Sütun Ekle
Satır ya da Sütun Sil
... drop() Fonksiyonu
...... axis Parametresi
...... inplace Parametresi
... drop_duplicates() Fonksiyonu
...... subset Parametresi
...... keep Parametresi
String Metotları
transpose() Fonksiyonu
apply() Fonksiyonu
Veri Çerçevelerini Birleştir
... concat() Fonksiyonu
... join() Fonksiyonu
...... how parametresi
...... left join
...... right join
...... outer join
...... inner join
... merge() Fonksiyonu
...... on Parametresi
...... how Parametresi
...... inner Seçeneği
...... outer Seçeneği
...... left Seçeneği
...... right Seçeneği
...... cross Seçeneği
... left_on Parametresi
... right_on Parametresi
... suffixes Parametresi
sort_index() Fonksiyonu
... ascending Parametresi
... axis Parametresi
sort_values() Fonksiyonu
... by Parametresi
... ascending Parametresi
... na_position Parametresi
reindex() Fonksiyonu
... columns Parametresi
... axis parametresi
...... index Seçeneği
...... columns Seçeneği
... Ek Bilgi
... Karşılaştırma Operatörü Kullanımı
...... "is" Operatorü
...... "." Operatorü
Karşılaştırma Operatorü Kullanımı
between() Fonksiyonu
Mantıksal Operatör Kullanımı
groupby() Fonksiyonu
10- pivot_table() FONKSİYONUNUN KULLANIMI
11- melt() FONKSİYONUNUN KULLANIMI
Aritmetik İşlem Operatörleri
... sum() Metodu
... mean() Metodu
Toplama, Çıkarma, Çarpma ve Bölme İşlemleri
... Toplama Operatörü
... Çıkarma Operatörü
... Çarpma Operatörü
... Bölme Operatörü
Mantıksal / Karşılaştırma Operatörleri
... Büyüktür (>)
... Küçüktür (<)
... Eşittir (==)
... Eşit Değildir (!=)
... İçerir (contains)
... İçermez / Değil (not)
Pandas Veri Çerçevesi Özet Bilgileri (CheatSheet)
Pandas Veri Çerçevesi (Data Frame) komutlarını (fonksiyon, metot, parametre) bir yerde toplayarak ihtiyaç halinde, farklı konulara ait komutlara daha hızlı ulaşabileceğimiz bir Başvuru Kılavuzu / Özet Bilgi Tablosu (CheatSheet) oluşturmaya çalışıyorum. Başvuru kılavuzunu / Özet Bilgi Tablosunu (CheatSheet) oluştururken, komutları, Pandas Veri Çerçevesi (Data Frame) Konu Başlıklarına göre kategorize etmeyi planlıyorum.
Sayfaya Yeni Konu başlıkları ekledikçe, Özet Bilgi Tablosunu da güncellemeye gayret edeceğim.
Şuana kadar oluşturduğum Başvuru Kılavuzu / Özet Bilgi Tablosu (CheatSheet) na ağaşıdaki bağlantıdan erişebilirsiniz.