Dünyadaki tüm verilerin %90'ının son 2 yılda oluştuğunu öğrenince oldukça şaşırıyoruz. Oysa her an, her yerden ulaşabildiğimiz paylaşım kanalları sonucu artık en çok kullanılan bilgi kaynaklarının Facebook, Twitter, Youtube, bloglar vs. olduğu yıllardır açıkca bilinen bir konu.
İnterneti cebimizde dolaştırmaya başladığımızda, kullanmaktan aldığımız zevk ve kolaylığın arttığını fark ediyorduk. Ancak bu kadar çok bilgiye ulaşmayı ve üretilen petabaytlarca veriyi kim tahmin ederdi ki?
Bireysel ve kurumsal verilerin, internet aracılığıyla tüm dünya ile paylaşılması çekiciliğini giderek arttırdı ve işte ortaya çıkan şey; Büyük Veri!
Videolar, müzikler, e-kitaplar, makaleler, kişisel paylaşım, tüketici tıklarının kaydedilmesi, arama motoru kayıtları vs. büyük veriyi oluşturan başlıca kaynaklar.
Peki bu büyük veri ne işe yarayacak ve nasıl kullanılacak?
Büyük Veri işletmeler için muazzam bir kaynak. Bu kaynaktan en uygun şekilde faydalanmak için öncelikle yapılması gereken büyük veriyi düzenli ve sade bir şekle getirmek, sınıflandırmak ve uygun alanlar için uygun verileri seçmek. Bunun yapılması için geliştirilmesi çalışılan yeni veri madenciliği yöntem ve teknikleri teknoloji şirketleri için rekabetçi bir Ar-Ge konusu. M2M çalışma prensibi ile belirlenen alanlarda doğru seçimin ve düzenlemenin yapılmasını sağlayan programlar, yazılımlar ve analiz teknikleri geliştiriliyor.
Büyük veriyi tüketici davranışlarını incelemek isteyen satıcılar, yaratıcı trendler oluşturmak isteyen yenilikçi şirketler ve mevcut durumu açıklamaya çalışan araştırmacılar yani hemen her iş alanından kurumlar kullanmak, değerlendirmek istiyor. Örneğin, paylaşılan günlük haberlerden, paylaşım sitelerinde en çok konuşulan haberlere ve ilgi çeken gündem başlıklarına ulaşan haberciler, o konular hakkında daha çok yazı ve görüşmelere yer verir, merak edilenleri anlamaya ve açıklamaya çalışır. Bu çok kısa sürede yapılabilcek bir analizdir.
Hedef tüketici kitlesinin davranışlarını inceleyen bir firma blog sayfalarında paylaşılanları analiz ediyor. Nerelerde hangi şekilde bulunursa daha etkili olabileceğini bu analiz sonucu çıkarabiliyor. Forumlarda paylaşılan çekinceler, sorular ve sorunlar ışığında ürün iyileştirmesine gidebiliyor. Tüm bu paylaşım sayfalarına ulaşmak ve onları bir araya getirmek için kullanılan big data ve analiz yöntemlerini de teknoloji şirketleri sunuyor.
M2M teknolojisi büyük veriyi kullanım sürecinde bir hayli etkili. Bunca çok datayı kendimiz bir araya getirip sınıflandırmamız mümkün değil. Bu yüzden büyük veriyi kullanırken dikkat edilmesi gereken büyüklük, hız, değer, doğruluk ve çeşitlilik gibi kavramların başarıya ulaşması için M2M teknolojisinin çok özenli kurulması gerekiyor.
Son dönemde yapılan araştırmalara göre;
- Mevcut verilerin yüzde 80’i yapısal değil; E-posta, fotoğraf, video, müzik dosyası, XML, vb şeklinde ortaya çıkan, geleneksel ilişkisel veri tabanlarında saklanmayan, “Gri Data” olarak adlandırılan “ham veri".
- Özellikle sağlık ve finans sektörü ile hükümetlerin "büyük veri" konusuna daha çok kafa yormaları gerekecek. Çünkü hukuki olarak geriye dönük bu devasa sayısal bilgilerin saklanması, yedeklenmesi, arşivlenmesi ve gerektiğinde hızlı olarak erişilebilir olması gerekiyor. İlk tahminler, ABD’nin sağlık sektörünün yıllık 300 milyar dolarlık büyük veri katma değerinde iş hacmine sahip olduğu yönünde.
Tabi ki veri mühendisliği kavramı da büyük veri ile önemini daha da arttıran bir alan. Yakın zamanda üniversitelerde bu isimde bölümlerin açılması ya da derslerin artması bekleniyor. Eğitim kurumlarıyla beraber çalışan ve eğitime önem veren kurumlar bu konuyu destekleyeceklerdir. Büyük verinin incelenmesi ve verimli bilgiye ulaşmak için yeni stratejiler araştırılmaya devam edilecektir.
Bu yazıyı okuyanlar, bunları da okudu;
Büyük Veri Ne Kadar Büyük? Ne İşe Yarar?
İnterneti Değiştiren 7 Veri Trendi
Nesnelerin İnterneti Nasıl Popüler Oldu?