Big Data Eğitimi

Big Data eğitimi, katılımcıların büyük veri ekosistemini uçtan uca kavrayarak, modern veri mimarilerini kurgulama ve yönetme becerisi kazanmalarını amaçlar. 4 gün sürecek yoğun program boyunca; Hadoop’un temelinden Spark’ın hızına, Kafka’nın gerçek zamanlı akışından NoSQL dünyasının esnekliğine kadar tüm kritik araçlar, gerçek dünya senaryoları ve pratik uygulamalarla ele alınır. Şirketlerin veri odaklı karar alma süreçlerini iyileştirmek ve rekabet avantajı sağlamak isteyen profesyoneller için tasarlanmıştır.

🗓️ Eğitim Süresi: 4 gün

🖥️ Eğitim Şekli: Online Canlı

Ön Gereksinimler

Temel linux komutlarına hakimiyet
İnternet bağlantısı

Eğitim İçeriği

1. GÜN: Büyük Veri Temelleri ve Depolama Mimarisi

Bölüm 1: Giriş ve EkosistemBüyük Veri (Big Data) nedir? 5V Kriteri ve Sektörel Kullanım Alanları.Büyük Veri Ortamının Kurulması (Docker ve Cluster Mimarileri).Hadoop Genel Tanıtımı ve Tarihsel Gelişimi.
Bölüm 2: Veri Depolama ve Kaynak YönetimiHDFS (Hadoop Distributed File System): Blok yapısı, replikasyon ve hata toleransı.Apache YARN: Kaynak yönetimi ve iş zamanlama (Scheduling).Bulut Depolama (S3/Azure Blob) ve HDFS Karşılaştırması.

2. GÜN: Büyük Veri Sorgulama ve Batch (Yığın) İşleme

Bölüm 3: SQL on Big Data (Sorgulama Katmanı)Apache Hive: Veri ambarı mimarisi ve SQL tabanlı sorgulama.Apache Trino (Presto): Dağıtık ve yüksek hızlı SQL motoru.
Bölüm 4: Modern Veri İşleme – Apache SparkSpark Mimarisi ve Bellek İçi (In-Memory) İşleme Avantajı.Spark Dataframe ve SQL: Yapılandırılmış veri ile modern çalışma teknikleri.Spark RDD Temelleri ve Optimizasyon Stratejileri (Shuffling, Partitioning).

3. GÜN: Veri Aktarımı ve Gerçek Zamanlı (Streaming) Sistemler

Bölüm 5: Veri Entegrasyonu ve Aktarımıİlişkisel Veritabanlarından Veri Aktarımı (ETL Süreçleri).Batch Veri Aktarım Stratejileri ve Araç Tanıtımları (Spark Ingestion).
Bölüm 6: Gerçek Zamanlı Veri İşlemeApache Kafka: Dağıtık mesajlaşma kuyrukları, Topic ve Producer/Consumer mantığı.Spark Streaming: Akan verinin (Real-time data) mikro-batch yöntemiyle işlenmesi.Gerçek Zamanlı Analitik Senaryoları (Fraud Detection, Log Analysis).

4. GÜN: NoSQL Veritabanları ve Uçtan Uca Uygulama

Bölüm 7: NoSQL Dünyası ve Veri ModellemeNoSQL Giriş: Neden ihtiyaç duyuyoruz? Relational vs. NoSQL.CAP Teoremi: Tutarlılık (Consistency), Erişilebilirlik (Availability) ve Bölünme Toleransı (Partition Tolerance) dengesi.Popüler NoSQL Çözümleri:MongoDB: Doküman tabanlı modelleme.Elasticsearch: Metin tabanlı arama ve analitik motoru.Cassandra: Geniş sütunlu (Wide-column) ve yüksek ölçeklenebilir mimari.
Bölüm 8: Final ve Proje SenaryosuBüyük Veri Proje Yönetimi: Planlama ve Mimari Kararlar.Uçtan Uca Case Study: Verinin Kafka’dan Spark’a, oradan NoSQL/HDFS’e yolculuğu.

Data engineering project bootcamp

Data engineering bootcamp

Kubernetes bootcamp for data professionals

N8n ai agent developer bootcamp

Ai ve llm bootcamp

Mlops & llmops bootcamp-8

Data 101 bootcamp