Teknolojinin baş döndürücü bir hızda değişmesiyle her gün milyonlarca veri üretiliyor. Üretilen bu verilerin anlamlı bir bilgiye dönüşmediği sürece bir anlam ifade etmiyor. Yığın halindeki verilerin işlenerek anlamlı hale getirilmesi ve bilgiye dönüştürülmesi amacıyla veri madenciliği (data mining) kavramı gelişmiştir.
Veri Madenciliği Nedir?
Veri madenciliği, büyük miktarda verinin işlenerek anlam kazandırılması ve gerekli işlemlerden geçirilerek bilgiye dönüştürülmesi işlemi olarak tanımlanır. Bu işlem sayesinde veriler arasındaki ilişkileri ortaya koymak ve gelecek müşteri davranışlarının tahmin edilmesi mümkün oluyor. Veri madenciliğinde milyarlarca veri arasında çalışmak mümkündür.
Veri madenciliğinin temel amacı, verinin sınıflandırılarak anlamlı veriler haline dönüştürülmesi ve kurumlardaki karar destek mekanizmaları olarak adlandırılan sistemler için değerli olan veriyi ortaya çıkarmaktır. Veri madenciliği disiplinler arası bir çalışmadır. İstatistik, veri tabanı teknolojileri, makine öğrenmesi, yapay zekâ ve görselleştirme gibi birçok farklı disiplini yöntemini kullanır.
Örnek vermek gerekirse, online mağazalar müşterilerin tüm bilgilerini ve alışverişlerini kayıt altında tutarlar. İşlenmediği sürece anlamsız birer veri yığını olan bu kayıtlar veri madenciliği sayesinde, müşterilerin satın alma eğilimlerini inceleyip kategorize ederek, indirimlerde hangi müşterilerin ilgilenebileceğini tespit edip daha fazla satış gerçekleştirebilir.
Veri Madenciliğinde Nasıl Bir Süreç İzleniyor?
Veri madenciliğinde istenen verinin büyüklüğü ve buna bağlı olarak gerçekleşen işleme işleminin uzunluğuna göre farklı süreçler takip edilebiliyor. Genel olarak veri madenciliğinde şöyle bir süreç izleniyor:
Veri yığınını elde etme ve güvenliğinin sağlanması
Veri temizleme (Smoothing)
Veri bütünleştirme (Damy – Optimization?
Veri indirgeme
Veri dönüştürme
İlgili veri madenciliği algoritmaları Uygulama (Kümeleme, sınıflandırma, karar destek araçları)
Sonuçları ilgili yazılım dillerinde test ve eğitim aşamasına sokma
Sonuçların değerlendirilmesi ve sunulması
Veri Madenciliğinin Kullanım Alanları
Pazarlama: Günümüzde veri madenciliği genellikle pazarlama alanında şirketler tarafından kullanılıyor. Örnek vermek gerekirse, şirket, elde ettiği verileri kullanarak, müşteri potansiyelini belirleyebiliyor.
Bankacılık: Müşteri ilişkileri yönetimi, kampanya yönetimi, kredi işlemleri ve kredi kartı sahtekarlığının önüne geçilmesi
İnsan Kaynakları Yönetimi: İnsan kaynağının en etkin ve verimli olarak kullanılması amacıyla veri oldukça önemlidir. Şirketten ayrılma olasılığı olan personelin belirlenmesi gibi işlemlerde veri kullanılır.
Sigortacılık: Soruşturma gerektiren tazmin taleplerinin saptanması
Telefonla pazarlama: Satış yapmak amacıyla görüşülecek kişilerin ilgi alanlarının saptanması ve buna yönelik ürünlerinin pazarlanması.
Teknolojinin baş döndürücü hızıyla birlikte veri madenciliği (data mining) alanındaki çalışmalar da artacak ve daha fazla alanda kullanılmaya başlayacaktır. Günümüzde veri madenciliği ağırlıklı olarak kâr amacı güden işletmeler kullanıyor. Veri madenciliğinin gelişmesiyle beraber daha fazla kişi ve kurum veri madenciliğini kullanır hale gelecektir. Her geçen gün artan veri yığınının düzenlenmesi ve organize edilmesinde veri madenciliği önemli rol oynuyor. Veri madenciliği şüphesiz geleceğin önemli meslek dallarından birisi olarak görülüyor.