Skip to content
Öğrencilere ve Mezunlarımıza Özel %20 İndirim Sepette!

Big Data Eğitimi

Big Data eğitimi, katılımcıların büyük veri ekosistemini uçtan uca kavrayarak, modern veri mimarilerini kurgulama ve yönetme becerisi kazanmalarını amaçlar. 4 gün sürecek yoğun program boyunca; Hadoop’un temelinden Spark’ın hızına, Kafka’nın gerçek zamanlı akışından NoSQL dünyasının esnekliğine kadar tüm kritik araçlar, gerçek dünya senaryoları ve pratik uygulamalarla ele alınır. Şirketlerin veri odaklı karar alma süreçlerini iyileştirmek ve rekabet avantajı sağlamak isteyen profesyoneller için tasarlanmıştır.

🗓️ Eğitim Süresi: 4 gün

🖥️ Eğitim Şekli: Online Canlı

  • Temel linux komutlarına hakimiyet
  • İnternet bağlantısı
1. GÜN: Büyük Veri Temelleri ve Depolama Mimarisi
  • Bölüm 1: Giriş ve EkosistemBüyük Veri (Big Data) nedir? 5V Kriteri ve Sektörel Kullanım Alanları.Büyük Veri Ortamının Kurulması (Docker ve Cluster Mimarileri).Hadoop Genel Tanıtımı ve Tarihsel Gelişimi.
  • Bölüm 2: Veri Depolama ve Kaynak YönetimiHDFS (Hadoop Distributed File System): Blok yapısı, replikasyon ve hata toleransı.Apache YARN: Kaynak yönetimi ve iş zamanlama (Scheduling).Bulut Depolama (S3/Azure Blob) ve HDFS Karşılaştırması.
2. GÜN: Büyük Veri Sorgulama ve Batch (Yığın) İşleme
  • Bölüm 3: SQL on Big Data (Sorgulama Katmanı)Apache Hive: Veri ambarı mimarisi ve SQL tabanlı sorgulama.Apache Trino (Presto): Dağıtık ve yüksek hızlı SQL motoru.
  • Bölüm 4: Modern Veri İşleme – Apache SparkSpark Mimarisi ve Bellek İçi (In-Memory) İşleme Avantajı.Spark Dataframe ve SQL: Yapılandırılmış veri ile modern çalışma teknikleri.Spark RDD Temelleri ve Optimizasyon Stratejileri (Shuffling, Partitioning).
3. GÜN: Veri Aktarımı ve Gerçek Zamanlı (Streaming) Sistemler
  • Bölüm 5: Veri Entegrasyonu ve Aktarımıİlişkisel Veritabanlarından Veri Aktarımı (ETL Süreçleri).Batch Veri Aktarım Stratejileri ve Araç Tanıtımları (Spark Ingestion).
  • Bölüm 6: Gerçek Zamanlı Veri İşlemeApache Kafka: Dağıtık mesajlaşma kuyrukları, Topic ve Producer/Consumer mantığı.Spark Streaming: Akan verinin (Real-time data) mikro-batch yöntemiyle işlenmesi.Gerçek Zamanlı Analitik Senaryoları (Fraud Detection, Log Analysis).
4. GÜN: NoSQL Veritabanları ve Uçtan Uca Uygulama
  • Bölüm 7: NoSQL Dünyası ve Veri ModellemeNoSQL Giriş: Neden ihtiyaç duyuyoruz? Relational vs. NoSQL.CAP Teoremi: Tutarlılık (Consistency), Erişilebilirlik (Availability) ve Bölünme Toleransı (Partition Tolerance) dengesi.Popüler NoSQL Çözümleri:MongoDB: Doküman tabanlı modelleme.Elasticsearch: Metin tabanlı arama ve analitik motoru.Cassandra: Geniş sütunlu (Wide-column) ve yüksek ölçeklenebilir mimari.
  • Bölüm 8: Final ve Proje SenaryosuBüyük Veri Proje Yönetimi: Planlama ve Mimari Kararlar.Uçtan Uca Case Study: Verinin Kafka’dan Spark’a, oradan NoSQL/HDFS’e yolculuğu.