DataFlow Nedir?
Google DataFlow, GCP’nin büyük veri işleme için hizmetidir. Apache Beam API’sini
temel alır ve işleme işlerini dağıtılmış bir şekilde çalıştırarak veri akışlarını işlemeyi
ve analiz etmeyi sağlar. DataFlow, ölçeklenebilirlik, otomatik işleme ve düşük
yönetim yükü gibi avantajlar sunar.
Apache Beam nedir?
Apache Beam, Apache Software Foundation tarafından geliştirilen açık kaynaklı bir
veri işleme modeli ve SDK ‘dır.
Apache Beam, büyük veri işleme, veri analitiği, akıllı veri işleme ve gerçek zamanlı
veri işleme gibi çeşitli veri işleme senaryolarında kullanılabilir. Açık kaynaklı olması,
topluluk tarafından desteklenmesi ve yaygın olarak kullanılması, Apache Beam’i
popüler bir veri işleme çözümü haline getirmiştir.
DataFlow’un Temel Özellikleri
DataFlow’un Çalışma Mantığı
DataFlow’un Kullanım Alanları
Dataflow Ortamını Tanıyalım
Dataflow ortamına erişmek için öncelikle bir Google Cloud hesabınız olması lazım
Eğer hesabınız var console.cloud.google.com a gidip arama kısmına Dataflow yazalım
ve en üstteki Dataflow a tıklayalım
Burası Dataflow un ana ekranı
Çalışan, duran, hata alan işlerinizi burada görebilir yönetebilirsiniz
Dataflow Jop başlatma
Dataflow da jop başlatmak için CREATE JOB FROM TEMPLATE yazısına tıklayalım
Dataflow Jop oluşturma için detay girilmesi
Evet Jop başarılı bir şekilde çalışıyor
Bir sonraki bültende görüşmek üzere