Pandas Özet Bilgi Tablosu (CheatSheet)

Pandas Veri Çerçevesi (Data Frame) komutlarını (fonksiyon, metot, parametre) bir yerde toplayarak ihtiyaç halinde, farklı konulara ait komutlara daha hızlı ulaşabileceğimiz bir Başvuru Kılavuzu / Özet Bilgi Tablosu (CheatSheet) oluşturmaya çalışıyorum. Başvuru kılavuzunu / Özet Bilgi Tablosunu (CheatSheet) oluşturuken, komutları, Pandas Veri Çerçevesi (Data Frame) Konu Başlıklarına göre kategorize etmeyi planlıyorum.

Sayfaya Yeni Konu başlıkları eklendikçe, Özet Bilgi Tablosunu da güncellemeye gayret edeceğim.
Şuana kadar oluşturduğum Başvuru Kılavuzu / Özet Bilgi Tablosu (CheatSheet) aşağıda istifadenize sunulmuştur.
Başvuru Kılavuzu / Özet Bilgi Tablosunun (CheatSheet) PDF uzantılı halini aşağıdaki bağlantıdan indirebilirsiniz.

  • PDF Dosyası: Pandas Özet Bilgi Tablosu (CheatSheet)
  • Tablonun PNG Uzantılı Hali;

    .:: AÇIKLAMA ::.
    import pandas as pd pd : pandas kütüphanesi için atanmış kısaltmayı temsil eder.
    df = pd.DataFrame(Veri_Yapısı)
    df = pd.read_excel(“excel.xlsx”)
    df : Oluşturulan Veri Çerçevesine (Data Frame’e) atanan kısaltmayı temsil eder. Bu kısaltmalar aşağıda kullanılmıştır.
    .:: VERİ ÇERÇEVESİ OLUŞTUR ::.
    Fonksiyon / Metot / Parametre Açıklama
    pd.DataFrame(dosya, nesne ya da sözlük) Bir Dosyadan, İterable Nesneden ya da Sözlük yapısından Veri Çerçevesi (Data Frame) Oluştur.
    pd.read_csv(“dosya_adı.csv”) CSV dosyasını içe aktararak Veri Çerçevesi Oluştur.
    pd.read_excel(“dosya_adı.uzantı”) Excel, Calc dosyalarını içe aktararak Veri Çerçevesi Oluştur.
    Bu fonksiyon xls, xlsx, xlsm, xlsb, odf, ods ve odt uzantılı dosyaları destekler.
    pd.read_sql(query,connection_object) Bir SQL veritabanını içe aktararak Veri Çerçevesi Oluştur.
    pd.read_html(url) Bir URL (websitesi) ya da yerel html dosyasından tablo içe aktararak Veri Çerçevesi Oluştur.
    pd.read_json(dosya_adı.json) JSON biçimindeki dosyayı içe aktararak Veri Çerçevesi Oluştur.
    pd.read_table(dosya_adı.csv) CSV dosyasını tablo olarak içe aktararak Veri Çerçevesi Oluştur. delimiter parametresi ile, tablo verilerini sütunlara bölebiliriz. Aksi halde her satırdaki veri bir sütuna yazılır.
    pd.read_table(“dosya_adı.csv”, delimiter=”,”)
    pd.read_clipboard() CTRL + C ile Panoya kopyaladığımız veriyi (örneğin bir Excel tablosu ya da websitesindeki tabloyu) Veri Çerçevesine dönüştürür.
    .:: VERİ ÇERÇEVESİNİ KEŞFET ::.
    Fonksiyon / Metot / Parametre Açıklama
    df.head() / df.head(n) Veri Çerçevesinin ilk n satırını görüntüler. Parantez içerisine sayı yazmazsak ilk 5 satırı görüntüler. Böylece Veri Çerçevesi hakkında ön bilgi edinmemizi sağlar.
    df.tail() / df.tail(n) Veri Çerçevesinin son n satırını görüntüler. Parantez içerisine sayı yazmazsak son 5 satırı görüntüler.
    df.columns Veri Çerçevelerinin başlık satırını çıktı olarak verir / görüntüler.
    len(df) Veri Çerçevesinin kaç satırdan oluştuğu bilgisini döndürür.
    df.info() Veri Çerçevesinin satır ve sütun sayısı, başlık tipleri (sayı, metin, ...vb) ve doluluk oranı (boş olmayan hücre sayısı) hakkında bilgi görüntüler.
    df.dtypes Veri çerçevesinin başlık tiplerini görüntüler.
    df.describe() Sayısal veri barındıran sütunlar hakkında detaylı matematiksel bilgiler verir. (Kaç adet veri olduğu, ortalamaları, en küçük ve en büyük sayı,...vb)
    df.shape Veri Çerçevesinin satır ve sütun bilgisini döndürür/görüntüler.
    df.index Veri Çerçevesinin indeks isimlerini döndürür/görüntüler.
    df.isnull().any() Veri Çerçevesinin herhangi bir boş değer içerip içermediğini görüntüler.
    .:: VERİ ÇERÇEVESİNİ DÜZENLE ::.
    Fonksiyon / Metot / Parametre Açıklama
    df = pd.read_excel(“dosya_adı.xls” ,index_col=0) Veri Çerçevesi (Data Frame) oluştururken, sütunlardan birini, indeks değeri olarak ayarlamak/atamak için index_col parametresi kullanılır. Parametreye, değer olarak, indis olarak atanacak Sütunun indis değeri yazılır.
    df.set_index(“Sütun_adı”) Veri Çerçevesi oluşturduktan sonra, istediğimiz zaman indeks değerlerini değiştiremek / atamak için set_index() parametresi kullanılır.
    df = pd.read_excel(“dosya_adı.xls”, usecols = [“Sütun1”, “Sütun5”, Sütun9”] Veri Çerçevesi (DataFrame) oluştururken, sadece istediğimiz sütunları kullanmak istediğimizde usecols parametresini kullanmalıyız. Değer olarak sütun adı ya da sütun indisi yazılabilir.
    df = pd.read_excel(“dosya_adı.xls”, usecols = [2,3,8]
    df = pd.read_excel(“dosya_adı.xls”, skiprows = [0,5,6] Veri Çerçevesi (DataFrame) oluştururken, atlamak / göz ardı etmek Veri Çerçevesine dahil etmemek için, skiprows parametresi kullanmalıyız.
    df["Yeni_Sütun_Adı"] = Atanacak_Değerler

    Örnek:
    df[“Toplam”] = df[“Sütun1”] + df[“Sütun2”]
    Veri Çerçevesi (DataFrame) Yeni Sütun eklemek ve bu sütuna Değer Atamak için bu yapıyı kullanabiliriz. Atanacak_Değerler, Liste yapısında olabileceği gibi, Diğer sütunların kopyası, matematik, mantık ya da karşılaştırma operatörleri ile belirlenmiş halleri de olabilir.
    df.drop("Satır ya da Sütun Adı", axis=0/1, inplace=True/False) Veri Çerçevesinden (Data Frame’den) Satır ya da Sütun Silmek istediğimizde drop() metodunu kullanabiliriz.
    axis = 0 (Sıfır) Satırları, axis = 1 (Bir) Sütunları temsil eder.
    inplace parametresi, gerçekleştirilen silme işleminin kalıcı ya da geçici olmasını ayarladığımız kısımdır. inplace = True yazılırsa, yapılan işlem kalıcı hale gelecektir.
    .:: STRİNG METOTLARI ::.
    df[“Sütun1”].str.upper() Sütun1’deki Metinsel ifadelerin tümünü büyük harf çevirir.
    df[“Sütun1”].str.lower() Sütun1’deki Metinsel ifadelerin tümünü küçük harf çevirir.
    df[“Sütun1”].str.capitalize() Sütun1’deki Metinsel ifadelerin sadece baş harflerini büyük harf çevirir.
    .:: VERİYİ DIŞA AKTAR / FARKLI BİÇİMDE KAYDET ::.
    Fonksiyon / Metot / Parametre Açıklama
    df.to_csv(“dosya_adı.csv”) Veri Çerçevesini CSV dosyası olarak Dışa Aktar/Kaydet.
    df.to_excel(“dosya_adı.uzantı”) Veri Çerçevesini Excel / Calc olarak Dışa Aktar/Kaydet.
    xls, xlsx, xlsm, xlsb, odf, ods ve odt uzantılı dosyalar desteklenir.
    df.to_sql(tablo_adı,baglantı_nesnesi) Veri Çerçevesini SQL Veri Tabanı olarak Dışa Aktar/Kaydet.
    df.to_json(“dosya_adı.json”) Veri Çerçevesini JSON dosyası olarak Dışa Aktar/Kaydet.