Büyük Veri (Big Data) Nedir? Hakkında Bilmemiz Gerekenler
“Büyük Veri nedir?” Sorusunu cevaplamadan önce verinin tanımına bakmak gerekir. Veri, işlemlerin bir bilgisayar tarafından gerçekleştirildiği, elektrik sinyalleri şeklinde depolanıp iletilebilen ve manyetik, optik veya mekanik kayıt ortamlarına kaydedilebilen miktarlar, karakterler veya sembollerdir.
Büyük Veri de bir veridir ancak büyük boyutludur. Büyük Veri, büyük boyutta olan ve zamanla katlanarak büyüyen bir veri topluluğunu tanımlamak için kullanılan bir terimdir. Kısacası, bu tür veriler o kadar geniş ve karmaşıktır ki geleneksel veri yönetimi araçlarının hiçbiri bu verileri saklayamaz veya verimli bir şekilde işleyemez.
Büyük Veri örnekleri
- New York Menkul Kıymetler Borsası günde yaklaşık bir terabayt yeni ticaret verisi üretir.
- İstatistikler, sosyal medya sitesi Facebook’un her gün 500+ terabaytlık yeni veriyi veri tabanına aldığını gösteriyor. Bu veriler çoğunlukla fotoğraf ve video yüklemeleri, mesaj alışverişi, yorum koyma vb. olarak sıralanıyor.
- Tek bir jet motoru 30 dakikalık uçuş süresi içinde 10 terabaytın üzerinde veri üretebilir. Her gün yapılan binlerce uçuşla, veri üretimi binlerce petabayta ulaşıyor.
Büyük Veri türleri
Büyük Veri üç biçimde gruplandırılır:
- Yapılandırılmış veri
- Yapılandırılmamış veri
- Yarı yapılandırılmış veri
Yapılandırılmış: Sabit format biçiminde saklanabilen, erişilebilen ve işlenebilen veriler ‘yapılandırılmış’ veri olarak adlandırılır.
Yapılandırılmamış: Bilinmeyen formda veya yapıdaki veriler yapılandırılmamış veriler olarak sınıflandırılır.
Büyük Verinin V’leri
V’ler, büyük veriyi karakterize eden temel kavramları ifade eder. V harfini almalarının sebebi İngilizcede tüm bu kavramların V harfi ile başlamasından dolayıdır.
Bilginin hacmi (volume): Veri hacmi önemlidir. Büyük Veri ile, yüksek hacmi olan düşük yoğunluklu ve yapılandırılmamış verileri işlemeniz gerekir. Bu, Twitter verileri, bir web sayfasındaki tıklama akışları veya mobil uygulama veya sensor etkin donanımlar gibi bilinmeyen değerdeki veriler olabilir. Bazı kuruluşlar için bu onlarca terabayt veriyi içerebilir. Diğerleri için, yüzlerce petabayt olabilir.
Bilginin toplandığı hız (velocity): Bilginin toplandığı hız, bilginin alındığı ve belki de üzerinde aksiyon alındığı verinin hızıdır. Verilerin talepleri karşılamak için ne kadar hızlı üretilip işlendiği, verilerdeki gerçek potansiyeli belirler.
Bilginin çeşitliliği (variety): Çeşitlilik, mevcut olan birçok veri türünü ifade eder. Çeşitlilik ayrıca hem yapılandırılmış hem de yapılandırılmamış heterojen kaynakları ve verilerin niteliğini ifade eder. Daha önceki günlerde, elektronik tablolar ve veri tabanları çoğu uygulama tarafından değerlendirilen tek veri kaynağıydı. Günümüzde analiz uygulamalarında e-posta, fotoğraf, video, izleme cihazı, PDF, ses gibi veriler dikkate alınmaktadır. Yapılandırılmamış bu çeşitlilikteki veriler, depolama, madencilik ve verilerin analizinde bazı hususları ortaya koymaktadır.
Bilginin doğruluğu (veracity): Veri doğruluğu, veri kümelerindeki kesinlik derecesini belirtir. Sosyal medya platformları ve web sayfaları gibi birden fazla kaynaktan toplanan belirsiz ham veriler, kesin olarak tespit edilmesi zor olabilecek ciddi veri kalitesi sorunlarına neden olabilir.
Bilginin değeri (value): Bazı veri bilimcileri, Büyük Verilerin özellikleri listesine beşinci bir V değeri de ekler. Yukarıda açıklandığı gibi, toplanan verilerin tümü gerçek ticari değere sahip değildir ve yanlış verilerin kullanımı, analitik uygulamalarının sağladığı öngörüleri zayıflatabilir.
Bilginin değişkenliği (variability): Bu, veriler tarafından zaman zaman gösterilebilecek tutarsızlığı ifade eder. Böylece verileri etkin bir şekilde kullanma ve yönetme sürecini engeller.
Büyük Verinin Avantajları
1. Markalar karar alırken dış kaynaklardan faydalanabilirler
Arama motorlarından ve Facebook, Twitter gibi sitelerden alınan sosyal verilere erişim, kuruluşların işletme stratejilerini hassas bir şekilde ayarlamalarını sağlar.
2. Geliştirilmiş müşteri hizmetleri
Geleneksel müşteri geri bildirim sistemleri, Büyük Veri teknolojileriyle tasarlanan yeni sistemlerle değiştiriliyor. Bu yeni sistemlerde, Büyük Veri ve doğal dil işleme teknolojileri tüketici yanıtlarını okumak ve değerlendirmek için kullanılıyor.
3. Varsa, ürün ve hizmetlere ilişkin risklerin erken tanımlanması
4. Daha iyi operasyonel verimlilik
Hangi verilerin veri ambarına taşınması gerektiğini belirlemeden önce, yeni veriler için bir evreleme alanı oluşturmak için Büyük Veri teknolojileri kullanılabilir. Ek olarak, Büyük Veri teknolojilerinin ve veri ambarının bu şekilde entegrasyonu bir organizasyonun nadiren erişilen verileri boşaltmasına yardımcı olur.
Büyük Verinin kullanım alanları
Veri analistleri, bir bağlantının olup olmadığını belirlemek için demografik veriler ve satın alma geçmişi gibi farklı veri türleri arasındaki ilişkiye bakar. Bu tür değerlendirmeler bir şirket içinde kurulacak bir ekiple veya büyük verileri sindirilebilir formatlarda işlemeye odaklanan bir 3rd party kuruluş tarafından yapılabilir. İşletmeler, bu tür uzmanlar tarafından büyük verilerin değerlendirilmesini, işlem yapılabilir bilgiye dönüştürmek için sıklıkla kullanırlar.
Bir şirketteki hemen hemen her departman – insan kaynakları ve teknolojiden pazarlama ve satışa kadar – veri analizindeki bulgulardan faydalanabilir. Büyük Verilerin amacı, ürünlerin pazarlanma hızını artırmak, pazarın benimsenmesi, hedef kitlelerin kazanılması için gereken zaman ve kaynak miktarını azaltmak; müşterilerin memnun kalmasını sağlamaktır.
Özet
- Büyük Veri, büyük boyutlu veri olarak tanımlanır. Büyük Veri, büyük boyutta olan ve zamanla katlanarak büyüyen bir veri topluluğunu tanımlamak için kullanılan bir terimdir.
- Büyük Veri üretimi örnekleri arasında borsalar, sosyal medya siteleri, jet motorları vb. sayılabilir.
- Büyük Veri Yapılandırılmış, Yapılandırılmamış, Yarı yapılandırılmış olarak gruplandırılır.
- Bilginin hacmi, çeşitliliği, hızı, doğruluğu, değeri ve değişkenliği, Büyük Verinin karakteristikleri olarak adlandırılabilir.
Gelişmiş müşteri hizmetleri, daha iyi operasyonel verimlilik, daha iyi karar verme Büyük Verinin birkaç avantajıdır.