.:: AÇIKLAMA ::. |
import pandas as pd |
pd : pandas kütüphanesi için atanmış kısaltmayı temsil eder. |
df = pd.DataFrame(Veri_Yapısı) df = pd.read_excel(“excel.xlsx”) |
df : Oluşturulan Veri Çerçevesine (Data Frame’e) atanan kısaltmayı temsil eder. Bu kısaltmalar aşağıda kullanılmıştır. |
.:: VERİ ÇERÇEVESİ OLUŞTUR ::. |
Fonksiyon / Metot / Parametre |
Açıklama |
pd.DataFrame(dosya, nesne ya da sözlük) |
Bir Dosyadan, İterable Nesneden ya da Sözlük yapısından Veri Çerçevesi (Data Frame) Oluştur. |
pd.read_csv(“dosya_adı.csv”) |
CSV dosyasını içe aktararak Veri Çerçevesi Oluştur. |
pd.read_excel(“dosya_adı.uzantı”) |
Excel, Calc dosyalarını içe aktararak Veri Çerçevesi Oluştur. Bu fonksiyon xls, xlsx, xlsm, xlsb, odf, ods ve odt uzantılı dosyaları destekler. |
pd.read_sql(query,connection_object) |
Bir SQL veritabanını içe aktararak Veri Çerçevesi Oluştur. |
pd.read_html(url) |
Bir URL (websitesi) ya da yerel html dosyasından tablo içe aktararak Veri Çerçevesi Oluştur. |
pd.read_json(dosya_adı.json) |
JSON biçimindeki dosyayı içe aktararak Veri Çerçevesi Oluştur. |
pd.read_table(dosya_adı.csv) |
CSV dosyasını tablo olarak içe aktararak Veri Çerçevesi Oluştur. delimiter parametresi ile, tablo verilerini sütunlara bölebiliriz. Aksi halde her satırdaki veri bir sütuna yazılır. |
pd.read_table(“dosya_adı.csv”, delimiter=”,”) |
pd.read_clipboard() |
CTRL + C ile Panoya kopyaladığımız veriyi (örneğin bir Excel tablosu ya da websitesindeki tabloyu) Veri Çerçevesine dönüştürür. |
.:: VERİ ÇERÇEVESİNİ KEŞFET ::. |
Fonksiyon / Metot / Parametre |
Açıklama |
df.head() / df.head(n) |
Veri Çerçevesinin ilk n satırını görüntüler. Parantez içerisine sayı yazmazsak ilk 5 satırı görüntüler. Böylece Veri Çerçevesi hakkında ön bilgi edinmemizi sağlar. |
df.tail() / df.tail(n) |
Veri Çerçevesinin son n satırını görüntüler. Parantez içerisine sayı yazmazsak son 5 satırı görüntüler. |
df.columns |
Veri Çerçevelerinin başlık satırını çıktı olarak verir / görüntüler. |
len(df) |
Veri Çerçevesinin kaç satırdan oluştuğu bilgisini döndürür. |
df.info() |
Veri Çerçevesinin satır ve sütun sayısı, başlık tipleri (sayı, metin, ...vb) ve doluluk oranı (boş olmayan hücre sayısı) hakkında bilgi görüntüler. |
df.dtypes |
Veri çerçevesinin başlık tiplerini görüntüler. |
df.describe() |
Sayısal veri barındıran sütunlar hakkında detaylı matematiksel bilgiler verir. (Kaç adet veri olduğu, ortalamaları, en küçük ve en büyük sayı,...vb) |
df.shape |
Veri Çerçevesinin satır ve sütun bilgisini döndürür/görüntüler. |
df.index |
Veri Çerçevesinin indeks isimlerini döndürür/görüntüler. |
df.isnull().any() |
Veri Çerçevesinin herhangi bir boş değer içerip içermediğini görüntüler. |
.:: VERİ ÇERÇEVESİNİ DÜZENLE ::. |
Fonksiyon / Metot / Parametre |
Açıklama |
df = pd.read_excel(“dosya_adı.xls” ,index_col=0) |
Veri Çerçevesi (Data Frame) oluştururken, sütunlardan birini, indeks değeri olarak ayarlamak/atamak için index_col parametresi kullanılır. Parametreye, değer olarak, indis olarak atanacak Sütunun indis değeri yazılır. |
df.set_index(“Sütun_adı”) |
Veri Çerçevesi oluşturduktan sonra, istediğimiz zaman indeks değerlerini değiştiremek / atamak için set_index() parametresi kullanılır. |
df = pd.read_excel(“dosya_adı.xls”, usecols = [“Sütun1”, “Sütun5”, Sütun9”] |
Veri Çerçevesi (DataFrame) oluştururken, sadece istediğimiz sütunları kullanmak istediğimizde usecols parametresini kullanmalıyız. Değer olarak sütun adı ya da sütun indisi yazılabilir. |
df = pd.read_excel(“dosya_adı.xls”, usecols = [2,3,8] |
df = pd.read_excel(“dosya_adı.xls”, skiprows = [0,5,6] |
Veri Çerçevesi (DataFrame) oluştururken, atlamak / göz ardı etmek Veri Çerçevesine dahil etmemek için, skiprows parametresi kullanmalıyız. |
df["Yeni_Sütun_Adı"] = Atanacak_Değerler
Örnek: df[“Toplam”] = df[“Sütun1”] + df[“Sütun2”] |
Veri Çerçevesi (DataFrame) Yeni Sütun eklemek ve bu sütuna Değer Atamak için bu yapıyı kullanabiliriz. Atanacak_Değerler, Liste yapısında olabileceği gibi, Diğer sütunların kopyası, matematik, mantık ya da karşılaştırma operatörleri ile belirlenmiş halleri de olabilir. |
df.drop("Satır ya da Sütun Adı", axis=0/1, inplace=True/False) |
Veri Çerçevesinden (Data Frame’den) Satır ya da Sütun Silmek istediğimizde drop() metodunu kullanabiliriz. axis = 0 (Sıfır) Satırları, axis = 1 (Bir) Sütunları temsil eder. inplace parametresi, gerçekleştirilen silme işleminin kalıcı ya da geçici olmasını ayarladığımız kısımdır. inplace = True yazılırsa, yapılan işlem kalıcı hale gelecektir. |
.:: STRİNG METOTLARI ::. |
df[“Sütun1”].str.upper() |
Sütun1’deki Metinsel ifadelerin tümünü büyük harf çevirir. |
df[“Sütun1”].str.lower() |
Sütun1’deki Metinsel ifadelerin tümünü küçük harf çevirir. |
df[“Sütun1”].str.capitalize() |
Sütun1’deki Metinsel ifadelerin sadece baş harflerini büyük harf çevirir. |
.:: VERİYİ DIŞA AKTAR / FARKLI BİÇİMDE KAYDET ::. |
Fonksiyon / Metot / Parametre |
Açıklama |
df.to_csv(“dosya_adı.csv”) |
Veri Çerçevesini CSV dosyası olarak Dışa Aktar/Kaydet. |
df.to_excel(“dosya_adı.uzantı”) |
Veri Çerçevesini Excel / Calc olarak Dışa Aktar/Kaydet. xls, xlsx, xlsm, xlsb, odf, ods ve odt uzantılı dosyalar desteklenir. |
df.to_sql(tablo_adı,baglantı_nesnesi) |
Veri Çerçevesini SQL Veri Tabanı olarak Dışa Aktar/Kaydet. |
df.to_json(“dosya_adı.json”) |
Veri Çerçevesini JSON dosyası olarak Dışa Aktar/Kaydet. |