Bilginin günümüzdeki yeri ve önemi şüphesiz tartışılmaz boyuttadır. Bilgi ve teknolojinin şekillendirdiği dünyamızda bilginin üretimi ve yayılma hızı akıl almaz boyuttadır. Milyonlarca veriyle beslenen küresel bir sistemi göz önünde bulundurursak, bu sistemin beslenebilmesi için verinin işlendiği büyük bir sistem gerekiyor. Big Data, verinin yer aldığı sistemden verinin analiz edilerek sınıflandırılmış ve işlenebilir hale dönüştürülmüş halidir.
Big Data (Büyük Veri) Nedir?
Big Data kavramının tanımına bakmadan önce data yani veri kelimesini incelemek gerekiyor. Veri, araştırmalardan, gözlemlerden, internetten ve sosyal medyadan elde edilen işlenmemiş bilgi demektir.
Günümüz dünyasında her an milyonlarca veri üretiliyor. Bu verinin kullanılması ve anlamlı bir hale dönüştürülebilmişe için işlenmesi gerekiyor. Big Data, sosyal medya paylaşımları, fotoğraflar, belgeler gibi farklı kaynaklardan elde edilen verilerin anlamlı ve işlenebilir hale dönüştürülmüş biçimi olarak tanımlanabilir.
Yakın zamana kadar mevcut veri, belirlenen sayısal ya da sözel kompartımanlarda, dizayn edilmiş tablolarda korunmaktaydı. Ancak teknoloji ve internet çağı ile veri kavramı çok karmaşık bir hal aldı. Veri artık, veri tabanlarından fotoğraflara, videolardan ses kayıtlarına kadar her şeyi kapsamaya başladı. Bu nedenle, günümüzde veri çöplüğünün içinden anlamlı ve değerli verilerin çıkarılması zorunlu hale geldi. Veri tabanı uzmanları, ilişkili mevcut verileri ilişkisel veri tabanlarında (relational databases) yapısal biçimde sınıflandırıyor. Şirket yöneticileri de bu veri tabanlarında çalışan raporlama sistemleri aracılığıyla üretilen raporları kullanıyor.
Big Data (Büyük Veri) Nasıl İşler?
Big data, mevcut verileri en kullanışlı hale getirerek, kurumların ya da işletmelerin kullanımına sunmayı hedefler. Burada en yararlı bilgiye ulaşmak için verinin en sade ve işlenebilir haline ulaşmak gerekiyor. Birçok veri noktası karşılaştırılarak, verilerin birbirleriyle olan ilişkileri ortaya çıkarılır. Bu işlem, toplanan verilere dayanan yapı modelleri içeren bir işlemle sağlanır ve simülasyonlar çalıştırılır. Her defasında veri noktalarının yeri değiştirilerek sonuçların nasıl etkilendiğine bakılır.
Big Data Bileşenleri Nelerdir?
Big Data (Büyük Veri) kavramının oluşumunda üç bileşen vardır. Bu bileşenler; variety, velocity, volume olarak adlandırılır.
Variety (Çeşitlilik): Eskiden veri yönetimi, Excel tablolarından ibaretti. Günümüzde verinin farklı formatlarda saklanması gereken bir akış söz konusu. Excel, CSV, Access ya da PDF gibi birçok farklı formatta verinin depolanıyor. Tüm bu verilerin düzenlenmesi ve anlamlı verilerin oluşturulması gerekiyor. Büyük veri denilen bu kısım şirketler ve kurumlar için kritik öneme sahip.
Volume (Veri Büyüklüğü): Verinin sürekli olarak artması ve giderek veri yığınlarına dönüşmesi söz konusu olabilir. Bu verinin tutulduğu veri tabanı büyüdükçe yapının yeniden tasarlanmasını zorunlu kılabiliyor. Bazı durumlarda aynı verinin birden fazla noktadan incelenmesi gerekebiliyor.
Velocity (Hız): Big data üretimi her geçen gün artış gösteriyor. Bu nedenle, veriler saniyede inanılmaz boyutlara ulaşıyor. Hızlı büyüyen veri, o veriyi kullanması gereken işlem sayısının ve çeşitliliğinin aynı hızda artması anlamına geliyor. Hem yazılım hem de donanım olarak bu hız yoğunluğunu kaldırabilmek big data için oldukça önemli.