AnasayfaBlogVeri Madenciliği Nedir?
Nedir?

Veri Madenciliği Nedir?

09 Ocak 2020
Genç bir kadın önündeki dizüstü bilgisayar ekranını işaret ederken görülüyor. Kolunu uzatmış bir şekilde masada oturuyor ve eliyle dizüstü bilgisayarı işaret ediyor. Yüz ifadesi odaklanmış ve yoğun, konsantrasyonunu gösteriyor. Uzun, siyah saçları at kuyruğu şeklinde geriye doğru toplanmış ve gözleri dikkatle dizüstü bilgisayara odaklanmış. Dizüstü bilgisayar ekranı aydınlatılmış ve yan tarafta bir klavye görülebiliyor. Görüntü yakın plandan çekilmiştir ve izleyicinin kadının elinin, yüzünün ve dizüstü bilgisayarın ayrıntılarını görmesini sağlar. Sahne hafifçe bulanıklaştırılarak odaklanma hissine ve anın yoğunluğuna katkıda bulunulmuştur.
Veri Madenciliği Nedir?Veri Madenciliği SüreciVeri Madenciliği Neden Önemli?
Büyük miktarlarda bilginin toplanması ve içerisinden yararlı bilgilerin ayrıştırılma sürecidir.Veri Seçimi, Ön İşleme ve Temizleme, İndirgeme, Veriyi Dönüştürme, Veri Madenciliği, Yorumlama ve Doğrulama aşamalarını içerir.Değişen çevre koşulları, teknolojinin ilerlemesi ve globalleşen dünya ile bilginin önem kazanması ve veriyi anlamlı bir hale getirme gerekliliğinden dolayı önemlidir.
Açık ve kapalı veri toplama yöntemleri kullanılarak veri toplanır ve işlenir.Veri seçiminde kaliteli verinin belirlenmesi, verinin kullanılabilir hale getirilmesi, verinin indirgenmesi ve dönüştürülmesi ve en sonunda veri madenciliği sürecine geçilir.Verinin hızla artması ve internet ve veri ambarlarında çok fazla verinin depolanması, veri madenciliğini zorunlu kılar.
Veriler işlendikten sonra anlamlı bilgiye dönüşür ve ileriye yönelik tahminler yapılabilir.Veri madenciliği sürecinde çeşitli veri madenciliği yöntemleri kullanılır ve gerektiğinde farklı yöntemler birleştirilerek uygulanır.Kesin bilginin azalması, hipotezler oluşturma ve karar alma gerekliliğinin doğması, otomatik veri toplama istasyonlarının geliştirilmesi ve bilimsel hesapların yapılabilmesi, veri madenciliğini önemli kılar.
Veri madenciliği, şirketlerin ve kurumların karar organları için değerli olan veriyi belirli yöntemler ve işlemler ile ortaya çıkarma sürecidir.Son aşamada elde edilen verinin yorumlanması ve doğrulanması sürecidir.Verilerin içerisindeki desenlerin, ilişkilerin, değişimlerin, düzensizliklerin, kuralların ve istatistiksel olarak önemli yapıların keşfedilmesi ve bu bilgilerin analiz edilerek geçmiş veriler ile gelecek tahminlerinin yapılmasını sağlar.

Teknolojinin hızla gelişmesi, fazlaca verinin elektronik ortama kaydedilmesini, saklanabilmesini ve gerektiğinde kolaylıkla erişilmesini sağladı. Cep telefonu, bilgisayar ve tabletlerden günlük tüm işlemlerimizi yapabilmekteyiz. Kişisel ya da işinize ait verilerinizin etken olarak muhafaza edilmesi data mining’i yani veri madenciliğini oluşturdu.

Veri madenciliği, büyük miktarlarda bilginin toplanması ve içerisinden yararlı bilgilerin ayrıştırılmasıdır. Veriler işlenmediği sürece bir değer taşımazlar, yığın halinde yer alan tüm veriler işlenerek bilgiye dönüştürülür. Bilgisayar ortamında yer alan yığınla veri, veri madenciliği ile anlam kazanır ve ileriye yönelik olarak doğru tahminlerde bulunulmasını kolaylaştırır. Veri madenciliğinin temel amacının, şirketlerin ya da kurumların karar organları için değerli olan veriyi belirli yöntemler ve işlemler ile ortaya çıkarmak olduğunu söyleyebiliriz.

Veriler Nasıl Toplanır?

Verilerin 2 farklı biçimde toplandığından bahsedebiliriz. Açık ve Kapalı olmak üzere toplanır.

Açık veri toplama, sizin isteyerek verdiğiniz bilgilerden oluşur. Genellikle bir e-ticaret sitesine veya sosyal medyaya üye olurken sizden istenilen bilgiler ile oluşturulur. Siz, sisteme işlemeye başladıkça veri ambarı da dolmaya başlar. E-ticaret sitesine veya sosyal medyaya üye olurken sizden istenilen bilgiler ile oluşturulur. Siz, sisteme işlemeye başladıkça veri ambarı da dolmaya başlar.

Kapalı veri toplama da durum biraz değişmektedir. Üye olduğunuz site veya sosyal medya uygulamasında gezindiğiniz sayfalarla, ilgilendiğiniz mal ve hizmetler ile veriler toplanır ve depolanır. Hareket ve alışkanlıklarınız izlenir. Tüm bunların sonucunda ziyaretçi ilgisinin artması için çalışmalar yapılır ve dijital pazarlama araçlarına ihtiyaç duyulur.

Veri Madenciliğinde Nasıl Bir Süreç İzlenmektedir?

Verileri sağlıklı bir şekilde depolamak ve ihtiyacınız olan veriye başarılı bir şekilde ulaşabilmek için belirli aşamaları takip etmelisiniz.

  • Veri Seçimi: Bu aşamayı filtreleme olarak da adlandırabiliriz. En fazla zaman alan kısımlardan biridir. Burada bilgi iyi analiz edilmeli ve problemlerle ilişkilendirilmelidir. Analizi yapacak olan kişinin veri kalitesini ölçmesi açısından önem taşımaktadır. Veri seçimi aşamasını filtrelendirme olarak da adlandırabiliriz.

  • Ön İşleme ve Temizleme: Bu aşamada veri kullanışlı hale getirilmeye çalışılır, veri madenciliğinin başarısı için ehemmiyetlidir. Temizlenmesi gereken veri temizlenmeli ve eksik kalan veri yerine yenisi eklenmelidir. Buradaki başarı, sonuçtaki başarıyı etkiler ve kesin, net sonuçlara ulaşırsınız.

  • İndirgeme: Veriler ön işlemeden geçmiş olsa bile kullanılabilecek durumda değildir, kullanılması için indirgenmesi gerekir. Ancak bu şekilde faydalı ve doğru sonuçlara ulaşılabilir. Sonuca etkisi önemsenmeyecek kadar az olan veri ve değişkenlerin sayısının azaltılmasıdır.

  • Veriyi Dönüştürme: Bazı durumlarda veriyi aynen çözümlemelere katamayız. Değişkenlerin sahip olduğu çok büyük ve çok küçük değişkenler çözümlemelerin sağlıklı bir şekilde yapılmasını engeller. Bu nedenle değişkenler normalleştirilmeli ve standartlaştırılmalıdır.

  • Veri Madenciliği: Çalışmanın tam olarak kullanıldığı yerdir. Veri bu aşamaya geldiğinde kullanılabilir haldedir. Amaca göre veri madenciliği yöntemleri kullanılır. Kümeleme, sınıflandırma ve karar destek ağaçlarından uygun olanlar uygulanır. Gerektiğinde farklı yöntemler birleştirilerek uygulanabilir. Sonuçların ilgili yazılım dillerinde eğitim ve test aşamasına sokulması (R, Python, Java)

  • Yorumlama ve Doğrulama: Veri madenciliği ile sonuçlar alındıktan sonra yorumlanır ve doğru sonuca ulaşıp ulaşmadığı araştırılır. Farklı uygulamaların karşılaştırılması yapılır ve elde edilen tüm sonuçlar mukayese edilir ve istenilen bilgiye ulaşılır.

Veri Madenciliği sisteminin temel bileşenleri:

  • Veri tabanı, veri ambarı ve farklı depolama seçenekleri,

  • Veri ambarı sunucusu,

  • Bilgi tabanı,

  • Data mining motoru,

  • Örüntü değerlendirme,

  • Kullanıcı Arayüzü

Veri Madenciliği Neden Önemlidir?

Değişen çevre koşulları, teknolojinin ilerlemesi ve sınırların ortadan kalkması ile globalleşen dünya, pazarlama ve araştırma geliştirme yöntemleri verinin değil, bilginin önemli olduğunu ortaya koymuştur. Veri madenciliği, verilerin içerisindeki desenlerin, ilişkilerin, değişimlerin, düzensizliklerin, kuralların ve istatistiksel olarak önemli yapıların keşfedilmesidir. Bilginin çeşitli yöntemler ile analiz edilmesi ve sonuçların profesyoneller tarafından yorumlanması ve geçmiş veriler ile gelecek tahminlerinin yapılmasına data mining denir ve veri madenciliğini ortaya çıkaran ve zorunlu hale getiren unsurlar bulunmaktadır.

  • Veri kayıtlarının hızla artması, internet ve veri ambarlarında çok fazla verinin depolanması,

  • Veri sınıflandırılması ve gruplandırılması,

  • Kesin bilginin azalması, hipotezler oluşturma ve karar alma gerekliliğinin doğması,

  • Otomatik veri toplama istasyonlarının geliştirilmesi,

  • Bilimsel hesaplamalar, benzetimler ve modellemelerin gelişmesi,

  • Uydu ve uzaktan algılama sistemlerinin geliştirilmesi,

  • Geleneksel eski tekniklerin ham verileri işlemede yetersiz kalması.

Veri Madenciliği İçin Hangi Yetkinliklere Sahip Olunmalı?

binlerce hatta milyonlarca veri üzerinde araştırma yapmak çok ciddi bir emek, sabır ve dayanıklılık gerektirmektedir. Bilgisayar sistemlerinde sıklıkla karşılaşılan sorunlarda ve ani değişmelerde verileri dikkatli bir şekilde koruyabilmeli. Tabii ki gelişmiş seviye de yazılım bilgisi, yöneylem, ileri seviye matematik, istatistik, lineer cebir ve optimizasyon bilgisi gerekmektedir.

Yazılım dillerinden Python programlama ve R dilleri veri madenciliği için en uygun olanlardır. Hatta veriyi nasıl elde edeceğini biliyor olması en temel özelliği olmalıdır. Aynı zamanda deneme ve testler için Java dilini de bilmelidir. Uğraşları sonucu, verilerden elde ettiği bilgiyi kullanma ve anlatma becerisine sahip olmalıdır.

Veri Madenciliğini Hangi Alanlarda Uygulayabiliriz?

Veri işlenmediği sürece değersizdir. Yığın halinde yer alan veriler işlenerek, değerli hale gelir ve bilgiye dönüşür. Niteliklerine göre tanımlanmış sınıflara ayrılır. Firmalar karar alırken bu verileri kullanır ve gelecek yatırımlarına karar verirler. Uygulama alanları her sektörde oldukça geniştir, önemli olan hangi verilere doğru olarak ulaşmak istediğinizdir.

  • Müşterilerin daha iyi tanınması,

  • Müşteri sınıflandırılması yapılmasına fırsat tanınması,

  • Müşteriler için davranış modelleri oluşturulması için yardımcı olunması,

  • Müşterilerin ödeme performanslarının ölçülmesi ve elde edilen bilgilere göre risk yönetim politikalarının oluşturulması,

  • İyi müşteri sınıflandırmasının yapılması ve hem bu müşteriler hem de diğer müşteriler için farklı pazarlama stratejileri oluşturulması,

  • Müşterilerin davranışlarına göre kampanya hazırlanması ve kampanyalara göre müşteri kitlesi belirlenmesi,

  • Elde edilen sonuçlara göre çapraz ve dikey satış artırma stratejilerinin oluşturulması,

  • Kara para trafiğinin belirlenmesi,

  • İnternet işlemleri, e-nakit dolandırıcılığı

  • Bilgisayar sistemleri ve bilgisayar ağlarına girilmesi,

  • Kredi taleplerinin değerlendirilmesinin kolaylaştırılması,

  • Kredi kartı dolandırıcılıklarının tespit edilmesi,

  • Müşterilere kişiselleşmiş ürün ve hizmet sunulması,

  • Tıp alanında, hastalara tanı konulmasına destek olunması ve hastaya özel tedavi yöntemi belirlenmesi

  • Spor alanında, rakip taktiklerinin belirlenmesine yardımcı olunması gibi sayabiliriz.

Örnek üzerinden ilerleyecek olursak, aynı süpermarketten alışveriş yapan müşteriler için özel olarak kart çıkartarak aslında müşterilerinin bilgilerini saklarlar. Alışveriş eğilimleri, en çok haftanın hangi günleri alışveriş yaptıkları ya da en çok promosyonu kullandıkları bilgilerini kayıt ederler. İlk bakışta çok anlamsız gibi görünse de elde ettikleri bilgiler ile, o müşteriye özel promosyon oluşturarak daha fazla satış gerçekleştirirler.

Büyük miktarlarda bilginin toplanması ve içerisinden yararlı bilgilerin ayrıştırılma sürecidir, Veri Seçimi, Ön İşleme ve Temizleme, İndirgeme, Veriyi Dönüştürme, Veri Madenciliği, Yorumlama ve Doğrulama aşamalarını içerir, Değişen çevre koşulları, teknolojinin ilerlemesi ve globalleşen dünya ile bilginin önem kazanması ve veriyi anlamlı bir hale getirme gerekliliğinden dolayı önemlidir, Açık ve kapalı veri toplama yöntemleri kullanılarak veri toplanır ve işlenir, Veri seçiminde kaliteli verinin belirlenmesi, verinin kullanılabilir hale getirilmesi, verinin indirgenmesi ve dönüştürülmesi ve en sonunda veri madenciliği sürecine geçilir, Verinin hızla artması ve internet ve veri ambarlarında çok fazla verinin depolanması, veri madenciliğini zorunlu kılar, Veriler işlendikten sonra anlamlı bilgiye dönüşür ve ileriye yönelik tahminler yapılabilir, Veri madenciliği sürecinde çeşitli veri madenciliği yöntemleri kullanılır ve gerektiğinde farklı yöntemler birleştirilerek uygulanır, Kesin bilginin azalması, hipotezler oluşturma ve karar alma gerekliliğinin doğması, otomatik veri toplama istasyonlarının geliştirilmesi ve bilimsel hesapların yapılabilmesi, veri madenciliğini önemli kılar, Veri madenciliği, şirketlerin ve kurumların karar organları için değerli olan veriyi belirli yöntemler ve işlemler ile ortaya çıkarma sürecidir, Son aşamada elde edilen verinin yorumlanması ve doğrulanması sürecidir, Verilerin içerisindeki desenlerin, ilişkilerin, değişimlerin, düzensizliklerin, kuralların ve istatistiksel olarak önemli yapıların keşfedilmesi ve bu bilgilerin analiz edilerek geçmiş veriler ile gelecek tahminlerinin yapılmasını sağlar
bilgi data mining veri veri madenciliği veri toplama
Genç bir kadın beyaz dişlerini göstererek kameraya doğru gülümsüyor. Parlak kahverengi gözleri ve yüzünden geriye doğru toplanmış uzun, siyah saçları var. Beyaz yakalı ve manşetli mavi bir gömlek ve beyaz bir etek giyiyor. Kollarını göğsünün önünde kavuşturmuş ve kendinden emin bir duruşu var. Yüzü yandan gelen ışıkla aydınlanmakta, sıcak ve davetkâr bir atmosfer yaratmaktadır. Rahatlamış ve mutlu bir halde görünüyor.
Tuba Kamaşoğlu Çağlar
Blog Yazarı

İnsan kaynakları, mülakat tavsiyeleri ve cv hazırlama konularında içerik üretiyor.

Benzer Yazılar
Doğru ve faydalı bilgiler sağlama konusunda kararlı olan uzman ekibimizle blogumuzu her zaman yeni makaleler ve videolarla güncelliyoruz. Güvenilir tavsiyeler ve bilgilendirici içerikler arıyorsanız, blog sayfamıza mutlaka göz atın.
Bu görsel Excel hakkında bir çevrimiçi kursu tasvir etmektedir. Gözlük takan ve sakallı bir adam, konu hakkında bilgili ve deneyimli olduğunu gösteriyor. Gri arka plan üzerinde Excel Kursu - Excel Öğrenimi yazan metin de bunu doğruluyor. Yüzünün yakın çekimi, konuya olan güvenini gösteriyor. Ayrıca, gri arka plan üzerindeki beyaz metin, kursun kapsamlı ve bilgilendirici olduğunu gösteriyor. Adamın gözlükleri ve siyah gömleği profesyonel olduğunu, burnunun yakın çekimi ise son derece odaklanmış olduğunu gösteriyor. Bu görsel, öğrencinin deneyimli ve bilgili bir eğitmen tarafından verilen kapsamlı ve ilgi çekici bir çevrimiçi Excel kursu alacağını iletir.
4.9
(558)

Excel Eğitimi

10 Konu5 Saat
Bu görselde ileri Excel eğitimi için dizüstü bilgisayar kullanan bir kişi yer almaktadır. Dizüstü bilgisayar açık ve kullanıcı klavyede yazıyor, bu da kursa aktif olarak katıldığını gösteriyor. Arka planda, öğrenme atmosferine katkıda bulunan siyah metinli bir tabela ve ahşap bir yüzey üzerinde bir tabak antep fıstığı görülebiliyor. Ayrıca, muhtemelen kurs sırasında içilen bir fincan kahvenin yakın çekimi ve rahatlatıcı ve konforlu bir ortam yaratan bir bitkinin yakın çekimi de bulunmaktadır. Dizüstü bilgisayar ekranında, kullanıcının aktif olarak verileri analiz ettiğini gösteren bir grafik görülebiliyor. Tüm bunlar bir araya gelerek bu ileri düzey Excel eğitim kursu için ideal bir öğrenme ortamı oluşturuyor.
4.9
(302)

İleri Excel Eğitimi

25 Konu4 Saat
Bu görüntü bir grafiğin yakın çekimidir. Siyah beyaz ekranlı beyaz bir dizüstü bilgisayarda görüntülenmektedir. Sağ üst köşede siyah metinli dikdörtgen siyah beyaz bir işaret görülmektedir. Grafik, her birinde bir sayı ve yazı tipi bulunan birkaç paralel çizgiden oluşmaktadır. Sayılar ve yazı tipi beyaz zemin üzerine siyah elle yazılmıştır. Grafik beyaz bir arka plan üzerinde görüntüleniyor ve metin net bir şekilde görülebiliyor. Bu görüntü ekran görüntüsü, metin, sayı, yazı tipi, paralel çizgiler, el yazısı ve belge için harika bir örnektir.
5
(8)

Makro Eğitimi

46 Konu12 Saat
Bu görüntü, içinde bir insan olan siyah bir daireden oluşuyor. Kişi kollarını iki yana açmış, kameraya dönük bir şekilde durmaktadır. Kişi beyaz bir gömlek ve mavi bir kot pantolon giymektedir. Arka plan gri tonda. Kişinin açık kahverengi gözleri ve kısa siyah saçları var. Daire pürüzsüz, kavisli bir dokuya ve parlak bir yüzeye sahip. Kişi kendinden emin ve güçlü görünüyor. Çemberin ortasında dururken kararlı bir ifadesi var. Resmin atmosferi davetkâr ve sıcak.Ders Eğitmeni
1102607