Pandas Özet Bilgi Tablosu (CheatSheet)

Pzt 28 Şubat 2022

Modified: 2024-01-20 15:38 Category: Pandas Tags: Python, Pandas, Kütüphane, Modül Author: Mustafa Halil

Pandas Özet Bilgi Tablosu (CheatSheet)

Pandas Veri Çerçevesi (Data Frame) komutlarını (fonksiyon, metot, parametre) bir yerde toplayarak ihtiyaç halinde, farklı konulara ait komutlara daha hızlı ulaşabileceğimiz bir Başvuru Kılavuzu / Özet Bilgi Tablosu (CheatSheet) oluşturmaya çalışıyorum.

Başvuru kılavuzunu / Özet Bilgi Tablosunu (CheatSheet) oluştururken, komutları, Pandas Veri Çerçevesi (Data Frame) Konu Başlıklarına göre kategorize etmeyi planlıyorum.

Sayfaya Yeni Konu başlıkları eklendikçe, Özet Bilgi Tablosunu da güncellemeye gayret edeceğim.
Şuana kadar oluşturduğum Başvuru Kılavuzu / Özet Bilgi Tablosu (CheatSheet) aşağıda istifadenize sunulmuştur.
Başvuru Kılavuzu / Özet Bilgi Tablosunun (CheatSheet) PDF uzantılı halini aşağıdaki bağlantıdan indirebilirsiniz.

PDF Dosyası: Pandas Özet Bilgi Tablosu (CheatSheet)

Tablonun PNG Uzantılı Hali;

CheatSheet

KÜTÜPHANEYİ İÇE AKTAR ( IMPORT )

Fonksiyon / Metot / Parametre	Açıklama
`import`	pd : pandas kütüphanesi için atanmış kısaltmayı temsil eder. Ör. `import pandas as pd`
`df`	df : Oluşturulan Veri Çerçevesine (Data Frame’e) atanan kısaltmayı temsil eder. Bu kısaltmalar aşağıda kullanılmıştır. Ör.1. `df = pd.DataFrame(Veri_Yapısı)` Ör.2. `df = pd.read_excel(“Verilerim.xlsx”)`

VERİ ÇERÇEVESİ OLUŞTUR

Fonksiyon / Metot / Parametre	Açıklama
`DataFrame()`	Bir Dosyadan, İterable Nesneden ya da Sözlük yapısından Veri Çerçevesi (Data Frame) Oluştur. Ör. `pd.DataFrame(dosya, nesne ya da sözlük)`
`read_csv()`	Bir CSV dosyasının içeriğinden Veri Çerçevesi Oluştur. `read_csv` kodu ile TXT uzantılı dosya içeriğini de okuyabiliriz. Ör. `pd.read_csv(“dosya_adı.csv”)`
* `read_csv(index_col=)`	`index_col` parametresi ile indeks değerini, istediğimiz sütuna eşitleyebiliriz. Ör. Name Sütununu, veri çerçevemizin indeks sütunu haline getirdik. Ör. `nba_csv = pd.read_csv("Veri_Setleri/nba.csv", index_col="Name")`
`read_table()`	CSV dosya içeriğinden tablo olarak Veri Çerçevesi Oluştur. Ör. `pd.read_table(dosya_adı.csv)`
* `read_table(delimiter=)`	`delimiter` parametresi ile, tablo verilerini sütunlara bölebiliriz. Aksi halde her satırdaki veri bir sütuna yazılır. Ör. `pd.read_table(“dosya_adı.csv”, delimiter=”,”)`
`read_excel()`	Excel, Calc dosyalarını içeriğinden Veri Çerçevesi Oluştur. Bu fonksiyon xls, xlsx, xlsm, xlsb, odf, ods ve odt uzantılı dosyaları destekler. Ör.** `pd.read_excel(“dosya_adı.uzantı”)`
* `read_excel(header=)`	Excel / Libre Ofis dosyasındaki ilk satırın başlık olmadığı, yani sadece verilerden oluşan dosya ile çalıştığımızda, `header=None` parametresi kullanılmalıdır. Ör. `df = pd.read_excel("Veri.ods", header = None)`
* `read_excel(names=)`	Başlık (sütun adlarını) belirtmek için `names` parametresi kullanılır. names parametresi, tablo ile eşit sayıda sütundan oluşan liste veri tipi olmalı. Ör. baslık tanımla; `baslik = ["Birler", "Onlar", "Yüzler"]` ardından; `df = pd.read_excel("Veri.ods", header = None, names = baslik)`
* `read_excel(sheet_name=)`	Excel dosyasındaki istediğimiz çalışma sayfasına erişebilmek için, `sheet_name` parametresini kullanmalıyız. Ör. `pd.read_excel(“Maliyet.xlsx”, sheet_name="birim fiyat")`
* `read_excel(index_col=)`	Veri Çerçevesi (Data Frame) oluştururken, sütunlardan birini, indeks değeri olarak ayarlamak, atamak için `index_col` parametresi kullanılır. Parametreye, değer olarak, indis olarak atanacak Sütunun indis değeri yazılır. Ör. `df = pd.read_excel(“dosya_adı.xls” ,index_col=0)`
* `read_excel(usecols=)`	Veri Çerçevesi (DataFrame) oluştururken, sadece istediğimiz sütunları kullanmak istediğimizde `usecols` parametresini kullanmalıyız. Değer olarak sütun adı da yazılabilir. Ör. `df = pd.read_excel(“dosya_adı.xls”, usecols = [“Sütun1”, “Sütun5”, Sütun9”]`
* `read_excel(decimal=)`	Veri çerçevesi oluşturuken ondalık ayırıcı ifadeyi belitrmek için `decimal = ","` parametresini kullanırız. Ör.`pd.read_excel("Veri_Setleri/imdb.xlsx", decimal=",")`
`read_sql()`	Bir SQL veritabanını okuyarak Veri Çerçevesi Oluştur. Ör. `pd.read_sql(query,connection_object)`
`read_html()`	Bir URL (websitesi) ya da yerel html dosyası içeriğinden Veri Çerçevesi Oluştur. Ör. `pd.read_html(url)`
`read_json()`	JSON biçimindeki dosyayı içe aktararak Veri Çerçevesi Oluştur. Ör. `pd.read_json(dosya_adı.json)`
`read_clipboard()`	CTRL + C ile Panoya kopyaladığımız veriden (örneğin bir Excel tablosundan ya da websitesindeki tablodan) Veri Çerçevesine oluştur. Ör. `pd.read_clipboard()`

VERİ ÇERÇEVESİNİ KEŞFET (İNCELE)

Fonksiyon / Metot / Parametre	Açıklama
`head()`	Veri Çerçevesinin ilk 5 satırını görüntüler. Böylece Veri Çerçevesi hakkında ön bilgi edinmemizi sağlar. `df.head()`
* `head(n)`	Parantez içerisine sayı yazarsak ilk "n" adet satır görüntülenir. Ör. `df.head(11)`
`tail()`	Veri Çerçevesinin son 5 satırını görüntüler. `df.tail()`
* `tail(n)`	Parantez içerisine sayı yazarsak son "n"" adet satır görüntülenir. Ör. `df.tail(3)`
`columns`	Veri Çerçevelerinin başlık satırını çıktı olarak verir, görüntüler. `df.columns`
`info()`	Veri Çerçevesinin satır ve sütun sayısı, başlık tipleri (sayı, metin, ...vb) ve doluluk oranı (boş olmayan hücre sayısı) hakkında bilgi görüntüler. `df.info()`
`dtypes`	Veri çerçevesinin başlık tiplerini görüntüler. `df.dtypes`
`describe()`	Sayısal veri barındıran sütunlar hakkında detaylı matematiksel bilgiler verir. (Kaç adet veri olduğu, ortalamaları, en küçük ve en büyük sayı,...vb) `df.describe()`
`shape`	Veri Çerçevesinin satır ve sütun bilgisini döndürür, görüntüler. `df.shape`
`index`	Veri Çerçevesinin indeks isimlerini döndürür, görüntüler. `df.index`
`isnull()`	Veri çerçevemizde eksik verileri tespit ederiz. `isnull` ifadesini, boş mu?, kayıp/eksik mi? sorusu olarak düşünebilirsiniz. False Eksik/Kayıp veri YOK, True ise Eksik/Kayıp veri VAR anlamına gelir.
* `isnull().any()`	Veri Çerçevesinin herhangi bir boş değer (eksik veri) içerip içermediğini görüntüler. `True` eksik veri bulunuyor; `False`, eksik veri bulunmuyor demek. `df.isnull().any()`
`value_counts()`	Veri çerçevemizde bir sütunda aynı verinin kaç kez tekrar ettiğini (kaç adet bulunduğunu) öğrenmek için kullanılır. `df.value_counts()`
`len(df)`	Veri Çerçevesinin kaç satırdan oluştuğu bilgisini döndürür.

VERİ SEÇİM YÖNTEMLERİ

Fonksiyon / Metot / Parametre	Açıklama
`iloc[]`	Veri Çerçevesinde istenilen indeks değerlerine göre satır ve sütunu seçmek/görüntülemek için kullanılır. Ör.1. Satır ve sütunun kesişim değeri için;`df.iloc[Satir_Numarası, Sütun_Numarası]` Ör.2. Bir aralık için; `df.iloc[[satır_listesi], [sütun_listesi]]`
`loc[]`	Etiketlere veya mantık (boole) dizisine göre bir satır ve sütun seçmek için kullanılır. Ör.1. Satır ve sütunun kesişim değeri için; `df.loc["Star Wars", "Puan"]` Ör.2. Bir aralık için; `df.loc["Star Wars"]` UYARI: `loc[]`metodu ile dilimleme işlemi yapılırken`:` karakterinin sağındaki bitiş değeri, standart python dilimleme işlemlerinin aksine, seçime DAHİL EDİLİR, unutmayın.
`at[]`	Bir satır/sütun etiket çifti belirterek tek bir değeri seçmek için kullanabiliriz. MS Excel ya da Libre Ofis Calc uygulamalarındaki satır ve sütun değerlerinin kesişimindeki hücre değerine ulaşmak ile aynı mantık. `loc[]` metoduna benzer şekilde kullanılır. yalnız tek bir değer almanız veya ayarlamanız gerekiyorsa `at[]`metodunu kullanın. Ör. `df.at["satır etiketi", "sütun etiketi"]`
`iat[]`	Satır/sütun çiftinde tamsayı belirtilerek tek bir değeri seçmek için kullanılır. `iloc[]` metoduna benzerdir, her iki metot ta tamsayı tabanlı aramalar sağlar. `at[]` metodunda etiket kullanırken`iat[]` metodunda indeks değeri olan tamsayı kullanılır. Ör.1. `df.iat[1, 2]` Ör.2. `df.loc[0].iat[1]`
`Index()`	Veri çerçevesindeki index isimlerine göre Sıralama ve satır seçimi yapmamızı sağlar. Ör. `df.loc[pd.Index(["viper", "cobra"], name="Baslik")]`
`lambda()`	`lambda()` fonksiyonu ile, belirteceğimiz koşulu sağlayan satırı seçmek için aşağıdaki kod mantığını kullanabiliriz. Ör. shield satırında 8'e eşit değer barındıran satırları seçelim. `df.loc[lambda df: df['shield'] == 8]`
`df.Sütun`	Sütun başlığını yazarak (eğer sütun başlığı, ismi boşluksuz ise), istediğimiz TEK sütunu seçebiliriz. Ör.1. `VeriCervecesiAdı.SütunAdı` , Ör.2. `df.Puan`
`df.[["Sütun1", "Sütun2"]]`	Sütun başlıklarını liste halinde yazarak, istediğimiz sütunları seçebiliriz. Ör. `df[["Yıl", "Puan"]]`

EKSİK - KAYIP VERİ YÖNTEMLERİ

Fonksiyon / Metot / Parametre	Açıklama
`isnull()`	Veri çerçevemizde eksik verileri tespit ederiz. `isnull` ifadesini, boş mu?, geçersiz mi?, kayıp/eksik mi? sorusu olarak düşünebilirsiniz. False (Yanlış) Eksik/Kayıp veri YOK, True (Doğru) ise Eksik/Kayıp veri VAR anlamına gelir. `df.isnull()`
* `isnull().sum()`	Veri çerçecevesinde kaç adet eksik, kayıp veri olduğunu belirtir. Çıktı olarak Sütun isimlerinde eksik veri değerlerini verir. `df.isnull().sum()`
* `isnull().any()`	Veri Çerçevesinin herhangi bir boş değer (eksik veri) içerip içermediğini görüntüler. `True` eksik veri bulunuyor; `False`, eksik veri bulunmuyor demek. `df.isnull().any()`
`dropna()`	Veri Çerçevelerinde eksik veri bulunan satır ve sütunları otomatik olarak silmek için kullanırız. Ör. `df.dropna(axis = 0)` Bu metodu parametresiz olarak kullandığımızda ( `df.dropna()` ), sadece eksik veri tespit edilen satırlar silinir. `df.dropna()`
* `dropna(axis=)`	`axis`, eksenleri tanımlayan parametredir. Sıfır (0) Satırları, Bir (1) Sütunları temsil eder. Varsayılan değer Sıfır(0) yani Satırlardır. Ör. `df.dropna(axis = 1)`
*`dropna(inplace=)`	`inplace` gerçekleştirilen silme işleminin veri çerçevesinde kalıcı ya da geçici olmasını ayarladığımız parametredir. `inplace = True` yazılırsa, yapılan işlem kalıcı hale gelecektir. Ör. `df.dropna(axis = 0, inplace = True`
* `dropna(thresh=)`	`thresh` parametresi, veri çerçevesinde en az kaç adet veri varsa satır ya da sütunun silinmemesi gerektiğini belirtir. Ör.1. `df.dropna(thresh=3)` Bu kod,en az 3 sağlam veri barındıran satırları silme demek oluyor. Ör.2.`df.dropna(axis=1, thresh=4)`
`fillna()`	Eksik verilerin yerine, yeni değer atamak istersek kullanırız. `df.fillna()`
* `fillna(value=)`	Eksik verilerin yerine yazdırmak istediğimiz değeri `value` parametresi ile belirtiriz. `value` parametresine sayısal değer yazacağımız zaman doğrudan değerin kendisini, metinsel (string) ifadeler de yazacağımız zaman ise tırnak işareti kullanmamız gerektiğini unutmamalıyız. Ör.1. `df.fillna(value=65` Ör.2.`df.fillna(value="mhalil")`
* `fillna(method=)`	Veri çerçevesinde boş hücreleri doldurmak için `method` parametresi kullanılabilir. method parametresinin alabileceği değerler; `backfill, bfill, pad, ffill` ve `None`'dır. Varsayılan (öntanımlı) değer None'dır.
* `fillna(method= "backfill")`	`backfill` seçeneği sayesinde boş hücreler, kendinden sonraki (altında bulunan) son geçerli hücrenin değer ile doldurulur.
* `fillna(method= "bfill")`	`bfill` seçeneği sayesinde boş hücreler, kendinden sonraki (altında bulunan) son geçerli hücrenin değer ile doldurulur.
* `fillna(method= "pad")`	`pad` seçeneği ile boş hücreler, kendinden önceki (üstünde bulunan) son geçerli hücrenin değeri ile doldurulur.
* `fillna(method= "ffill")`	`ffill` seçeneği ile boş hücreler, kendinden önceki (üstünde bulunan) son geçerli hücrenin değeri ile doldurulur.

VERİ ÇERÇEVESİ DÜZENLEME YÖNTEMLERİ

Fonksiyon / Metot / Parametre	Açıklama
`set_index()`	Veri Çerçevesi oluşturduktan sonra, istediğimiz zaman indeks değerlerini değiştiremek / atamak için `set_index()` parametresi kullanılır. Ör. `df.set_index(“Sütun_adı”)`
`read_excel(index_col=)`	Veri Çerçevesi (Data Frame) oluştururken, sütunlardan birini, indeks değeri olarak ayarlamak, atamak için `index_col` parametresi kullanılır. Parametreye, değer olarak, indis olarak atanacak Sütunun indis değeri yazılır. Ör. `df = pd.read_excel(“dosya_adı.xls” ,index_col=0)`
`read_excel(usecols=)`	Veri Çerçevesi (DataFrame) oluştururken, sadece istediğimiz sütunları kullanmak istediğimizde `usecols` parametresini kullanmalıyız. Değer olarak sütun adı da yazılabilir. Ör. `df = pd.read_excel(“dosya_adı.xls”, usecols=[“Sütun1”, “Sütun5”, Sütun9”]`
`read_excel(usecols=)`	`usecols` parametresine değer olarak sütun indisi de yazılabilir. Ör. `df = pd.read_excel(“dosya_adı.xls”, usecols = [2,3,8]`
`read_excel(skiprows=)`	Veri Çerçevesi (DataFrame) oluştururken, satırları atlamak / göz ardı etmek Veri Çerçevesine dahil etmemek için, `skiprows` parametresi kullanırız. `df= pd.read_excel(“dosya_adı.xls”, skiprows = [0,5,6]`
`drop()`	Veri Çerçevesinden Satır ya da Sütun Silmek istediğimizde `drop()` metodunu kullanabiliriz. Ör. `df.drop("Satır ya da Sütun Adı", axis= 0 / 1, inplace= True / False)`
* `drop(axis=)`	`axis` parametresi, satırın mı? sütunun mu? silinmesi gerektiğini belirtir.`axis = 0` Satırları, `axis = 1` Sütunları temsil eder. Ör. `df.drop("Yıl", axis=1)`
* `drop(inplace=)`	`inplace` parametresi, gerçekleştirilen silme işleminin kalıcı ya da geçici olmasını ayarladığımız kısımdır. `inplace = True` yazılırsa, yapılan işlem kalıcı hale gelecektir. Ör. `df.drop("Ortalama", axis=0 inplace = True)`
`drop_duplicates()`	Veri çerçevemizde çift kayıt varsa, yani tüm veriler aynı olan birden fazla satır verisi varsa, bunlardan biri kalacak şekilde diğerlerinin silmek için `df.drop_duplicates()` metodunu kullanırız.
*`drop_duplicates(subset=)`	Tüm satır verisi aynı olmasa da, sadece belirtilen sütunda aynı değere sahip verilerden birinin kalıp diğerlerinin silinmesini istersek `subset` parametresini kullanırız. Ör. `df.drop_duplicates(subset=["iş-meslek"])`
* `drop_duplicates(keep=)`	Çift verilerden İlki mi? sonuncu mu kalacak, buna karar vermek için `keep` parametresini kullanmamız gerekecek. Ör.`df.drop_duplicates(subset=["iş-meslek"], keep="last")`
`df["Yeni_Sütun_Adı"] = Atanacak_Değerler`	Veri Çerçevesi (DataFrame) Yeni Sütun eklemek ve bu sütuna Değer Atamak için bu yapıyı kullanabiliriz. Atanacak_Değerler, Liste yapısında olabileceği gibi, Diğer sütunların kopyası, matematik, mantık ya da karşılaştırma operatörleri ile belirlenmiş halleri de olabilir. Ör. `df[“Toplam”] = df[“Sütun1”] + df[“Sütun2”]`
`transpose()`	Satırları sütuna, sütunları satıra çevirme işlemini `transpose()` fonksiyonu yardımıyla gerçekleştirebiliriz. Ör. `df.transpose()`
`apply()`	Bir Fonksiyonu, veri çerçevemize uygulamak istersek, `apply()` fonksiyonu kullanmamız gerekir. Ör. `df.["İsim"].apply(buyuk_harf)`

VERİ ÇERÇEVESİ BİRLEŞTİRME YÖNTEMLERİ

Fonksiyon / Metot / Parametre	Açıklama
`concat()`	Veri çerçeveleri alt alta ya da yan yana birleştirir. Varsayılan değer satır bazlı yani alt alta birleşimdir. Ör.`pd.concat([df1, df2])`
* `concat(axis=)`	`axis` parametresi, 0 ve 1 değerlerini alır, 0 satırları, 1 ise sütunları temsil eder . Ör.`pd.concat([df1, df2], axis=1)`
`join()`	`join()` metodu, Veri çerçevelerini matematik dersinteki Kümeler konusu mantığıyla birleştirir. `join()` metodu, parametresiz kullanıldığında, varsayılan olarak left join (`how = "left"`) değerini alır. Ör. `df1.join(df4)`
* `join(how=)`	Veri çerçevelerinin, sağdaki ya da soldaki veri çerçevesine göre dahil edilme seçeneğini ayarlayabilir, veri çerçevelerinin birleşimini ya da kesişimini de alabiliriz. how parametresi, left, right, inner ve outer değerlerini alır. Varsayılan değer left'tir. (left join)
* `join(how="left")`	Sol tarafta yazılan veri çerçevesi temel alınır, (sağ tarafta yazılan veri çerçevesinde varsa), bu değerlerle birleştirilir. Ör. `df1.join(df4, how="left")`
* `join(how="right")`	Sağ tarafta yazılan veri çerçevesi temel alınır, (sol tarafta yazılan veri çerçevesinde varsa), bu değerlerle birleştirilir. Ör. `df1.join(df4, how="right")`
* `join(how="outer")`	Birleşik küme mantığı ile birleştirme işlemi gerçekleşir. Her iki veri çerçevesi TÜM İÇERİK alınıp, yanyana birleştirilir**. Ör.`df1.join(df4, how="outer")`
* `join(how="inner")`	Kesişim kümesi mantığı ile birleştirme işlemi gerçekleşir. İki veri çerçevesinde ORTAK İNDEKS DEĞERLERİNE sahip satırlar alınır, yanyana birleştirilir. Ör. `df1.join(df4, how="inner")`
`merge()`	`join()` fonksiyonuna benzer ancak bazı farklı özellikleri vardır. Veri Çerçevesi veya adlandırılmış Seri nesneleri veritabanı stili birleştirme yöntemi ile (SQL’de bulunan inner join, outer join … ‘e benzer) birleştirmek için `merge()` fonksiyonunu kullanılabilir. Ör. `DataFrame.merge(right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)`
* `merge(on=)`	`on`parametresi, Veri Çerçevelerinin hangi sütun baz alınarak birleştirileceğini belirteceğimiz parametredir. Ör. `pd.merge(vize, final, on = "Ogrenci")`
* `merge(how=)`	`how` parametresi, veri çerçevelerini birleştirirken matematikteki Kümeler konusuna benzer seçenekler sunar. `merge()`fonksiyonunda `how` parametresi kullanılmadığı taktirde varsayılan olarak `inner` seçeneği belirtilmiş olur ve birleştirilecek veri çerçevelerinin sadece ortak değerleri alınarak birleştirme işlemi gerçekleştirilir. Ör. `pd.merge(vize, final, on = "Ogrenci", how = "inner")` `how` Parametresi için kullanılabilecek seçenekler: inner (varsayılan) outer left right cross
** `merge(how="inner")`	İki veri çerçevesinde de bulunan ortak değerleri birleştirir. `how = "inner"` ibaresini yazsak ta yazmasak ta aynı sonucu elde ederiz. Ör. `pd.merge(vize, final, on = "Ogrenci", how = "inner")`
** `merge(how="outer")`	İki veri çerçevesinde bulunan tüm değerler birleştirilir. Sol tarafta yazılan veri çerçevesindeki değerler temel alınır. İki veri çerçevesinde bulunan ortak değerler korunur, aksi halde eksik değerler için NaN değeri atanır. Ör. `pd.merge(vize, final, on = "Ogrenci", how = "outer")`
** `merge(how="left")`	Yapılan birleştirme işleminde, sol tarafta yazılan veri çerçevesinin tüm değerlerini alır ve sağ tarafta yazılan veri çerçevesindeki ortak değerleri tabloya ekler. Solda yazılan veri çerçevesindeki değerlerin, sağda yazılan veri çerçevesinde karşılığı yoksa, ilgili sütuna NaN değeri atanır. Sağ tarafta yazılan veri çerçevesinin, sol tarafta yazılan veri çerçevesinde karşılığı yoksa, bu değerler yok sayılır, birleştirme işlemine dahil edilmez. Ör. `pd.merge(vize, final, on = "Ogrenci", how = "left")`
** `merge(how="right")`	Yapılan birleştirme işleminde, sağ tarafta yazılan veri çerçevesinin tüm değerlerini alır ve sol tarafta yazılan veri çerçevesindeki ortak değerleri tabloya ekler. Sağda yazılan veri çerçevesindeki değerlerin, solda yazılan veri çerçevesinde karşılığı yoksa, ilgili sütuna NaN değeri atanır. Sol tarafta yazılan veri çerçevesinin, sağ tarafta yazılan veri çerçevesinde karşılığı yoksa, bu değerler yok sayılır, birleştirme işlemine dahil edilmez. Ör. `pd.merge(vize, final, on = "Ogrenci", how = "right")`
** `merge(how="cross")`	`cross` seçeneği sonucunda, kartezyen çarpımı yöntemi ile birleştirme yapılır. Ör. `pd.merge(veri1, veri2, how="cross")`
** `merge(left_on=)`	Soldaki Veri Çerçevesi üzerinde birleştirmenin hangi düzeyde yapılacağını belirtmek için kullanılır. Sütun başlıklarının sonuna varsayılan _x ve _y sonekleri eklenir. `left_on` parametresi, etiket veya liste ya da dizi benzeri veri alır. Ör. `df1.merge(df2, left_on='Manav_1', right_on='Manav_2')`
** `merge(right_on=)`	Sağdaki Veri Çerçevesi üzerinde birleştirmenin hangi düzeyde yapılacağını belirtmek için kullanılır. Sütun başlıklarının sonuna varsayılan _x ve _y sonekleri eklenir. `right_on` parametresi, etiket veya liste ya da dizi benzeri veri alır. Ör. `df1.merge(df2, right_on='Manav_1', left_on='Manav_2')`
** `merge(suffixes=)`	`merge()`fonksiyonu ile birleştirme işlemi sonucunda, sütun başlıklarının sonuna eklenen _x ve _y değerini değiştirmek ve sütun başlıklarının sonuna, istediğimiz değeri eklemek için `suffixes` parametresini kullanırız. Ör. `df1.merge(df2, left_on='Manav_1', right_on='Manav_2', suffixes=("_bir", "_iki"))`

VERİ SIRALAMA YÖNTEMLERİ

Fonksiyon / Metot / Parametre	Açıklama
`sort_index()`	Veri çerçevesini indeks (dizin) değerine göre alfabetik olarak sıralamak için kullanılır. `df.sort_index()`
* `ascending`	Sıralamayı ters çevirmek için `ascending=False` parametresi kullanılabilir. `df.sort_index(ascending=False)`
* `axis`	Sütunlarda (sütun isimlerini) sıralama yapmak istersek `axis=1` parametresini kullanmamız gerekir. `axis` parametresinin varsayılan değeri 0 (sıfır) yani satırlardır. `df.sort_index(axis=1)` yazarak sütun isimlerinin alfabetik olarak sıralamış oluruz.
`sort_values()`	Veri çerçevesini istenilen sütun(lar)a göre sıralamak istersek, `sort_values()` fonksiyonunu kullanmalıyız. `df.sort_values(by="Yıl")` bu kod ile Yıl sütununa göre sıralama yapmış olduk. Sıralama işlemini birden fazla sütuna göre yapmak istersek, sütun isimlerini köşeli parantez içinde yani bir liste olarak belirtmemiz gerekir. `df.sort_values(by=["Puan", "Yıl"])`
* `ascending`	Sıralamayı ters çevirmek için `ascending=False` parametresi kullanılabilir. `df.sort_values(by="Yıl", ascending=False)`
* `na_position`	`sort_values()` fonksiyonu, `na_position` parametresi aracılığıyla NA (yani kayıp / eksik veri) değerlerini özel işleme tabi tutarak sıralayabilir. `df2.sort_values(by= "Sütun_4", na_position="first")` bu kod ile Sütun_4'e göre yapılacak sıralama işleminde, NaN değerlerini en üstte yer alır. Tersi istenirse `na_position` parametresine `"last"` seçeneğini vermemiz gerekir.
`reindex()`	`reindex()`, Pandas'ta temel veri sıralama (hizalama) yöntemlerinden biridir. Bir veri çerçevesinin satır ya da sütunlarını yeniden sıralamak için kullanılan en yaygın yöntemdir. Bu fonksiyon, hem seçim hem de sıralama (Dilimleme ve Filtreleme) mantığıyla çalışır. `df.reindex(["Fight Club ", "Pulp Fiction", "Inception", "The Godfather ", "The Dark Knight ", "Seven Samurai "])`
* `columns`	Sütun isimlerinin sırasını `reindex()` fonksiyonu yardımı ile değiştirmek istersek, `columns` parametresini kullanabiliriz. `df.reindex(columns=["Puan", "Yıl", "Oylayan_Kişi"])`
* `axis`	Veri çerçevenizin indeks değerlerini (satırlar) ya da sütun isimlerini `reindex()` fonksiyonun, `axis` parametresi ile de sıralayabilirsiniz. Bu parametre `index` ya da `columns` seçeneğini alır;
** `index`	Belirtilen bir index değerine göre sıralama yapmak için `axis` parametresine `index` seçeneğini yazmalıyız. `df.reindex([2,1,0], axis="index"` bu kod ile index'i 2,1,0 şeklinde sıralamış olduk.
** `columns`	Belirtilen bir Sütun ismine göre sıralama yapmak için `axis` parametresine `columns` seçeneğini yazmalıyız. `df.reindex(["S2","S1","S0"], axis="columns")`

VERİ FİLTRELEME YÖNTEMLERİ

Fonksiyon / Metot / Parametre	Açıklama
`==` operatörü	Veri çerçevesinin Yıl sütunu 2010'a eşit olan verileri filtrelemek istersek; `df[df["Yıl"] == 2010]`
`!=` operatörü	Veri çerçevesinin Yıl sütunu 20210'a eşit olmayan verileri filtrelemek istersek; `df[df["Yıl"] != 2010]`
`>` operatörü	Veri çerçevesinin Yıl sütunu 2015'ten büyük olan verileri filtrelemek istersek; `df[df["Yıl"] > 2015]`
`<` operatörü	Veri çerçevesinin Yıl sütunu 2015'ten küçük olan verileri filtrelemek istersek; `df[df["Yıl"] < 2015]`
`>=` operaörü	Veri çerçevesinin Puan sütununda 8.8 ve üzeri değere sahip verileri filtrelemek istersek; `df[df["Puan"] >= 8.8]`
`<=` operatörü	Veri çerçevesinin Puan sütununda 8.8 ve küçük değere sahip verileri filtrelemek istersek; `df[df["Puan"] <= 8.8]`
`&` operatörü	Birden fazla kriter içeren filtreleme işlemi uygulamak istersek, İki kriteri bir arada kullanmak istediğimizde VE simgesi olan & kullanılmalı; `filtre1 = df["MİKTAR"] > 80` `filtre2 = df["deger"] < 100` `df[filtre1 & filtre2]`
`\\|` operatörü	Birden fazla kriter içeren filtreleme işlemi uygulamak istersek, İki kriterden biri sağlandığında filtrelemek istediğimizde YA DA / VEYA simgesi olan \|** kullanılmalı; `filtre1 = df["MİKTAR"] > 80` `filtre2 = df["deger"] < 100` `df[filtre1 \\| filtre2]`
`between()` metodu	Bir sayısal aralık belirterek filtreleme yapmak istersek `between()` metodunu kullanabiliriz. Örneği 1960 ile 1980 yılları arasındaki filmleri filtrelemeye çalışalım. `df[df["Yıl"].between(1960,1980)]`

VERİ GRUPLAMA YÖNTEMLERİ

Fonksiyon / Metot / Parametre	Açıklama

STRİNG METOTLARI

Fonksiyon / Metot / Parametre	Açıklama
`str` Metotları	Filtreleme esnasında String Metotlarını kullanmak için `str` kelimesinden yararlanıyoruz.
* `str.lower()`	"Film Adı" sütunundaki tüm metinsel ifadeleri küçük harfe dönüştürmek istersek `lower()` metodunu kullanmalıyız; `df["Film Adı"] = df["Film Adı"].str.lower()`
* `str.upper()`	"Film Adı" sütunundaki tüm metinsel ifadeleri büyük harfe dönüştürmek istersek `upper()` metodunu kullanmalıyız; `df["Film Adı"] = df["Film Adı"].str.upper()`
* `str.capitalize()`	"Film Adı" sütunundaki tüm metinsel ifadelerin sadece baş harflerini büyük harf çevirir. `df["Film Adı"] = df[“Film Adı”].str.capitalize()`
* `str.contains()`	String metotlarından biri olan `contains` ile metin içerisinde içeren kelime ya da kelimeleri aratabiliyoruz `df[df["Film Adı"].str.contains("star wars")]`
* `str.startswith()`	`startswith()` metodu ile bir karakter dizisinin hangi karakter veya karakterlerle başladığını denetleyebiliriz. Örneğin E harfi ile başlayan malzemeleri filtreleyelim; `df[df["MALZEME"].str.startswith("E")]`
* `str.endswith()`	`endswith()` metodu ile bir karakter dizisinin hangi karakter veya karakterlerle bittiğini denetleyebiliriz. Örneğin Ü harfi ile biten malzemeleri filtreleyelim; `df[df["MALZEME"].str.endswith("Ü")]`

VERİYİ DIŞA AKTAR / FARKLI BİÇİMDE KAYDET

Fonksiyon / Metot / Parametre	Açıklama
`to_csv()`	Veri Çerçevesini CSV dosyası olarak Dışa Aktar/Kaydet. `df.to_csv(“dosya_adı.csv”)`
`to_excel()`	Veri Çerçevesini Excel / Calc olarak Dışa Aktar/Kaydet xls, xlsx, xlsm, xlsb, odf, ods ve odt uzantılı dosyalar desteklenir. `df.to_excel(“dosya_adı.uzantı”)`
`to_sql()`	Veri Çerçevesini SQL Veri Tabanı olarak Dışa Aktar/Kaydet. `df.to_sql(tablo_adı,baglantı_nesnesi)`
`to_json()`	Veri Çerçevesini JSON dosyası olarak Dışa Aktar/Kaydet. `df.to_json(“dosya_adı.json”)`

mhalil

Pandas Özet Bilgi Tablosu (CheatSheet)

Pandas Özet Bilgi Tablosu (CheatSheet)

Tablonun PNG Uzantılı Hali;

KÜTÜPHANEYİ İÇE AKTAR ( IMPORT )

VERİ ÇERÇEVESİ OLUŞTUR

VERİ ÇERÇEVESİNİ KEŞFET (İNCELE)

VERİ SEÇİM YÖNTEMLERİ

EKSİK - KAYIP VERİ YÖNTEMLERİ

VERİ ÇERÇEVESİ DÜZENLEME YÖNTEMLERİ

VERİ ÇERÇEVESİ BİRLEŞTİRME YÖNTEMLERİ

VERİ SIRALAMA YÖNTEMLERİ

VERİ FİLTRELEME YÖNTEMLERİ

VERİ GRUPLAMA YÖNTEMLERİ

STRİNG METOTLARI

VERİYİ DIŞA AKTAR / FARKLI BİÇİMDE KAYDET