Polars - 00 Giriş
Paz 26 Haziran 2022Polars Notları
Rust ve Python için Işık Hızında VeriÇerçevesi (DataFrame) Kütüphanesi.
Polars Nedir?
Polars
, Rust
programlama dilinde yazılmış ve temel olarak Apache Arrow
’u kullanan bir DataFrame kütüphanesidir. Veri düzenleme alışkanlıklarını bilen Polars
, okunabilir ve yüksek performanslı kod oluşturmanızı sağlayacak bir ifade dili kullanarak DataFrame'leri işlemek için tüm özellikleri içeren eksiksiz bir Python API
'ı sunar.
Apache Arrow Nedir?
Apache Arrow
, sütunlu verileri işleyen veri analitiği uygulamaları geliştirmek için dilden bağımsız bir yazılım çerçevesidir.
Polars Kütüphanesini Ne Zaman Kullanmalıyız?
Verimiz Pandas
için çok büyük, Spark
için çok küçük olduğunda Polars
kütüphanesi iyi bir çözüm olacaktır.
Polars - Python
Şahsen Python
programlama diline aşina olduğum için, python
dilinde polar
kütüphanesi kullanımına dair örnekler vereceğim.
KONU BAŞLIKLARI
Kavramlar
- Veri Tipleri
- Veri Yapıları
- Bağlamlar
- İfadeler
- Tembel / İstekli API
- Akış API'sı
İfadeler
- Temel Operatörler
- Fonksiyonlar
- Çevrim (Casting)
- Diziler (Strings)
- Kümeleme (# Aggregation)
- Kayıp Veri
- Pencere Fonksiyonları
- Katlamalar / Kıvrımlar (Folds)
- Listeler ve Diziler
- Kullanıcı Tanımlı Fonksiyonlar
- Numpy
Dönüşümler
- Birleştirmeler (Joins)
- Birleştirmeler (Concatenation)
- Özet Tablolar (Pivots)
- Eritmeler (Melts)
- Zaman Serileri
- Ayrıştırma (Parsing)
- Filtreleme
- Gruplama
- Yeniden Örnekleme
- Zaman dilimleri
Tembel API
- Kullanım
- Optimizasyon
- Şema
- Sorgu Planı
- Sorgu yürütme
IO (Girdi / Çıktı)
- CSV
- Parquet
- JSON dosyaları
- Çoklu
- Veritabanları
- AWS
- Google BigQuery
SQL
- Giriş
- SHOW TABLES (TABLOLARI GÖSTER)
- SELECT (SEÇİM / SEÇMEK)
- CREATE (OLUŞTUR)
- Ortak Tablo İfadeleri
Taşıma / Göç
- Pandas'tan Gelenler
- Apache Spark'tan Gelenler
Çeşitli
- Çoklu İşlem (Multiprocessing)
- Alternatifler
- Başvuru Kılavuzları
- Katkı