Veri madenciliği nedir?

 
       Bilgiye ulaşmanın kolay olduğu düşünülebilir, arama motorları, sosyal ağlar derken bu olay biraz daha sıkıntılar doğurabiliyor. 
 
Herkesin, her an içerik üretebildiğini düşünürsek, bu gerekli ve gereksiz bilgilerle dolu interneti daha verimli kullanabilmek için kimi filtrelere ihtiyacımız var. 

Arama motorları temel mantıkta bizim ulaşmak istediğimiz sonuca dair kayıtlı tuttuğu bilgileri bize en iyi şekilde sunmayı amaçlıyor. 

Manipülasyona uğrayabilen bu listeleme tekniklerinin ve arama motorlarının yeterli olmadığı noktalarda ise kişilerin veya kurumların oluşturduğu kendi veri kütüphaneleri devreye giriyor. 
 
Arşivlenmek istenen bilgilerin dışında içerikleri barındırmayan bir sistem içerisinden temiz bir istatistik çıkarıp, belirli kriterlere göre detaylı analiz yapma amacıyla çıkan veri madenciliği kavramı, günümüzde birçok alanda kullanılmaktadır. 

Bu bilgilerin bulunduğu veritabanları içerisinde bilgi madenciliği (knowledge mining from databases), bilgi çıkarımı (knowledge extraction), veri ve örüntü analizi (data/pattern analysis) gibi amaca uygun işlemler yapılabilir.

Kullanıldığı alanlardan birisi de medya takip sistemleridir. Kişisel bilgilerinizin veya markanızın medyadaki bilinirliğinden tutunda, belirli zaman aralıklarında ne kadar tekrar ettiğine kadar birçok değerlendirme yapılabilir. 
 
Medya takibi ile uğraşan firmalar ise, gündelik çıkan gazetelerden internette yayınlanan her yeni makaleyi (ilgili alandakileri kendi veritabanlarına ekleyerek) hafızalarına ekleyerek hızlı şekilde istedikleri zaman değerlendirebilecek halde saklarlar. Bu şekilde bilgi çöplüğüne dönüşen platformları listeleyen sistemlerden farklı olarak, doğru sonuçları sunabilecek ayrı bir sistem oluşturmuş olunur. 

Bu tür sistemleri oluşturmak için, bilgi saklama tiplerinden bu bilgileri işleme alanlarına kadar ciddi bir yazılım bilgisi gerekmektedir. İstenilen zamanda işlenebilecek doğru bilgiyi sunabilecek bir sistem oluşturmak, kullanılacak olan alana göre farklı yoğunlukta ön çalışma gerektirmektedir.

Analiz konusunda ise reklam planlamaları yapan ajanslar örnek gösterebilir. Herhangi bir ürünü alan kişilerin başka hangi ürünler ile ilgilendiğini istatistiksel olarak değerlendirip ona göre farklı girişimler ve çözümler ortaya çıkabilir. 
Ya da bir sağlık kuruluşunda, daha önceki ve belirli bir süredir tutulan kayıtlara göre; belirli bir hastalık ile gelen kişilerin daha sonraları hangi hastalıklara yakalandığını araştırmak için, arama motorlarından öte bu tür özel analiz sistemleri gerekmektedir.

Arama motorları bu sistemi her bilgi için gerçekleştirirler ve herhangi bir alanda bir sonuca ulaşmak isteyen kullanıcılara düzgün şekilde listelemeye çalışırlar. Bazı bilgileri araştırmak için bu tür herkese açık olan sistemler gereksiz olan bilgilerle dolu olabilir veya sağlıklı şekilde bilgi süzme kanallarına olmayabilir. 

Bunun için özel şekilde tasarlanmış veri madenciliği sistemleri devreye girer.