Page 57 - Bilgem Teknoloji Dergisi 15. Sayı
P. 57
Hadoop’un zaman içerisindeki etkilerini ve bazı zorluk ve sorunları da gün yüzüne çıkarmaya
popülerliğini anlamak için Google Trends başlamıştır.
[4] verilerinden yararlanabiliriz. Verilen
grafikte Hadoop, BigQuery [5], Databricks Karmaşıklık: Bir Hadoop kümesini yönetmek
[6], Redshift [7] ve Big Data(Büyük Veri) oldukça zordur. Özel beceriler ve sürekli bakım
terimlerinin zaman içerisinde arama trendleri gerektirir. Cloudera ve Hortonworks birleşmesi
gösterilmektedir. Hadoop ekosisteminin [8] sonrası önceden açık kaynak kodlu olarak
gelişmesi ve yaygınlaşması, beraberinde paylaşılan büyük veri yönetim platformları
büyük veri uygulamalarının uygulanabilirliğini ücretsiz lisans ile erişime kapatılmıştır. Açık
ve görünürlüğünü de artırmıştır. Hadoop kaynak kodlu son sürüm kullanıldığında
ekosistemine olan ilgi 2015 yılında zirveyi içerisindeki uygulama sürümleri eski kalmaktadır.
görürken ilerleyen zaman içerisinde görece Güncel Hadoop ve diğer servisler el ile kurulmak
azaldığı grafikte görülmektedir. Bununla istendiğinde uygun versiyonları bulmak ve
beraber büyük şirketlerin bulut üzerinde kurulumunu gerçekleştirip idame etmek
sağladığı BigQuery, Databricks ve Redshift gibi yüksek yetkinlik ve beraberinde yüksek maliyet
büyük veri çözümleri de popülerlik kazanmaya getirmektedir. Güncel tutulmayan servisler ise
başlamış ve 2022’de Hadoop ekosistemini güvenlik açıklarına sebep olabilmektedir.
geride bırakmıştır. Bir zamanların tartışmasız
seçeneği olan Hadoop ekosistemi kullanımının Ölçeklenebilirlik: Ölçeklenebilir olsa da HDFS’i
büyük veri ortamındaki hâkimiyetinde bir azalma ölçeklendirmek zahmetli olup performans
görülürken bulut tabanlı hizmetler ve nesne darboğazlarına yol açabilmektedir.
depolama ile birlikte, bulut ya da konteyner
tabanlı çözümler hızla popülerleşmektedir. Maliyet: Yerinde kurulumlar önemli donanım
Şimdi bu eğilimin arkasındaki nedenleri araştırıp yatırımı gerektirmektedir ve bulut hizmetleri
büyük veri teknolojisinin geleceğini keşfedelim. büyük veri kümeleri için yüksek maliyetlidir.
Hadoop, kullanıma girdiği ilk zamanlarda Sınırlı esneklik: Hadoop, yığın veri işlemleri için
dağıtık bilgi işleme altyapısı sağlayarak büyük optimize edilmiştir. Gerçek zamanlı analizler
veri işlemeyi devrimleştirdi. HDFS (Hadoop veya karmaşık iş yükleri için performansı düşük
Distributed File System) dosya sistemi, veri kalabilmekte ya da ihtiyacı karşılayamamaktadır.
depolamada ölçeklenebilirlik sorununa bir Günümüzde yapay zekâ uygulamalarındaki artış
çözüm sağlamıştır. Ancak ilerleyen zaman beraberinde daha ağır, dinamik ve çeşitli iş yükü
ve büyük veri teknolojilerin karmaşıklaşması, getirmektedir.
Hadoop ekosisteminin kullanımında yaşanan
TÜBİTAK BİLGEM TEKNOLOJİ ¬ TEMMUZ 2024 55