Büyük Sivas Haber | Sivas Haberleri | Haberler | Güncel Yerel Haberler

BU ALANA GÜNLÜK 50 TL'DEN SİZDE REKLAM VERİRSENİZ SİZİ DE GÜNLÜK 100.000 KİŞİ GÖRÜR - ARAYIN : 0544 433 15 55

Veri Madenciliği (Data Mining) Nedir?

Veri Madenciliği (Data Mining) Nedir?
büyük sivas haber
büyük sivas haber( [email protected] )
31 Temmuz 2019 - 15:13

Günümüzde teknoloji şirketleri ve kurumlar büyük veriler üzerine çalışmaktadır. Büyük bir veri yığınından yararlı bilgiyi çekip çıkarabilmek ise oldukça zahmetli bir iştir. Madencilik sonucunda edinilen kazanımları göz önünde bulundurursak şirketler için sadece sahip oldukları verileri değil dışarıdan alınan verileri de koruyabilmek ve işleyebilmek son derece hassas bir konu haline gelmiştir.  Hal böyle olunca veri madenciliği nedir? veri madenciliği ne işe yarar gibi sorularda çok defa sorulmaktadır.

Veri Madenciliği Nedir? Veri Madenciliği Ne İşe Yarar?

Biz de Büyük Sivas olarak editörlerimizden Buğra Özdal’ın, hocası CÜ Bilgisayar Mühendisliği Öğretim Üyesi Doç. Dr. Hidayet Takcı ile yaptığı röportajı sizlerle paylaştık. Bakalım neymiş bu veri madenciliği…

B. Özdal : Sayın hocam öncelikle sizi tanıyabilir miyiz?

H. Takcı : İsmim Hidayet Takcı. Sivas Cumhuriyet Üniversitesi Bilgisayar Mühendisliği bölümünde öğretim üyesi (Doç. Dr.) olarak görev yapmaktayım. Veritabanları, Veri Madenciliği ve Makine Öğrenmesi alanlarında dersler veriyorum. Aynı zamanda Veri Madenciliği, Makine Öğrenmesi ve Bilgi Güvenliği konularında akademik çalışmalar yapıyorum.

B. Özdal : Hocam Sivas Cumhuriyet Üniversitesi Bilgisayar Mühendisliği Bölümü hakkında bize kısaca bilgi verebilir misiniz?

H. Takcı : Sivas Cumhuriyet Üniversitesi Bilgisayar Mühendisliği Bölümü 2012 yılında aralarında bendenizin de bulunduğu kurucu üç öğretim üyesi ile eğitim öğretim faaliyetlerine başladı. Şu anda bölümümüzde 3 doçent öğretim üyesi, 3 doktor öğretim üyesi, 5 araştırma görevlisi olmak üzere toplam 11 öğretim elemanı bulunuyor. 2012 yılından bu yana dört kez mezun verdik. Toplam mezun sayımız 400, devam eden öğrenci sayımız ise 600 civarında. Bölümümüzde lisans seviyesinde verilen eğitim faaliyetlerine ek olarak Yapay Zeka, Veri Bilimi, Bilgi Güvenliği, Görüntü İşleme, Nesnelerin İnterneti gibi alanlarda akademik çalışmalarda yapılmakta.

B. Özdal : Bilgisayar Mühendisliği mesleğini ve Sivas Cumhuriyet Üniversitesi Bilgisayar Mühendisliği Bölümünü gençlere tavsiye eder misiniz?

H. Takcı : Ülkemizde ilk olarak 1977 yılında Hacettepe ve ODTÜ bünyesinde öğrenci almaya başlayan Bilgisayar Mühendisliği bölümü bugün hemen hemen her üniversitede yer almaktadır. Bütün dünyada artan yazılımcı ihtiyacı nedeniyle uzun yıllar boyunca da bilgisayar mühendisliği bölümleri revaçta kalacaktır. Tabi iyi eğitim almış olanlar ve kendini yetiştirenler daha iyi yerlerde görev alacak diğerleri daha vasat yerlerde olacaktır. Sivas Cumhuriyet Üniversitesi Bilgisayar Mühendisliği Bölümümüz de bölgesinde tercih edilmeyi hak eden başarılı bir bölümdür. Herkese tavsiye ederim.

B. Özdal : Sayın hocam az önce bölümde eğitim faaliyetlerine ek olarak bölümünüzde araştırma faaliyetleri yapıldığından bahsettiniz. Sizinle röportaj öncesi çalışma alanlarınıza baktığımızda bir konunun önce çıktığını gördük o konu da VERİ MADENCİLİĞİ. Veri madenciliği nedir bize biraz bahseder misiniz?

H. Takcı : Bu güzel soru için teşekkür ederim size. Veri Madenciliğini en iyi tarif edenlerden biri olan Usama Fayyad onu şöyle tarif ediyor: “Yüksek hacimli veri içerisindeki, gizli kalmış önemli bilgi ve örüntülerin otomatik veya yarı otomatik yöntemlerle açığa çıkarılmasıdır”. Sürecin madenciliğe benzetilmesi tesadüf değildir. Madenciler az miktardaki madeni bulmak için çok miktardaki toprakla uzun süre çalışırlar. Bir gram altın madeni çıkarmak için tonlarca toprak çıkarmak gerektiği herkesin malumudur. Veri madenciliği bu yüzden zorlu bir süreçtir fakat deneyim sayesinde veriden anlamlı ve faydalı bilgiler çıkarılabilmektedir.

B. Özdal : Veri madenciliği bir süreçtir diyorsunuz pekâlâ bu süreç kabaca nasıl bir süreçtir?

H. Takcı : Veri madenciliği temel olarak iki alt süreçten oluşur: keşif (discovery) ve analiz (analysis). Keşif işlemi; verinin açıklanması, istatistiksel açıdan özetlenmesi, grafik ve şekillerle görselleştirmesinin yapılması gibi özellikler içerir. Keşif işlemi üzerinde çalışılan veri içerisinde önemli bir bilgi olup olmadığına dair ilk ipuçlarını verecektir. Keşif işleminin ardından analiz işlemi gelir. Veri üzerinde dikkat çekici noktalar keşif ile anlaşıldıktan sonra bu noktaların nedenleri analiz aşamasında ortaya çıkarılır. Analiz için ise açıklamalı ve tahminsel yöntemler kullanılır. Dolayısıyla keşif ve analiz veriye yaklaşmada en önemli iki adımdır.

B. Özdal : Veri madenciliğinin geri planında neler bulunur? Kimler bu konuya girmeli veya kimler bu konuya daha erken dâhil olabilir?

H. Takcı : Veri madenciliğinin kökeninde; makine öğrenmesi, istatistik ve veritabanları yer alır. Fakat veri madenciliği bunlardan hiçbiri ile tek başına açıklanamaz. Veritabanı teknolojisi ile alakalıdır çünkü OLAP başta olmak üzere bazı yöntemler veritabanları ile veri madenciliğinin arakesitinde yer alır. Makine öğrenmesi ile alakalıdır çünkü verilerden öğrenme yapılmakta ve öğrenme işlemi makine öğrenimi teknikleri ile yerine getirilmektedir. İstatistik ile alakalıdır çünkü birçok analiz sonucunun yorumlanmasında istatistik bilgisine ihtiyaç duyulmaktadır. Bunlara ek olarak matematik ve görselleştirme teknikleriyle de alakalıdır. Alakalarından dolayı istatistikçiler, bilgisayarcılar, matematikçiler vs. veri madenciliği alanına daha hızlı adapte olabilirler.

B. Özdal : Bize veri madenciliği ile çözülebilecek en az bir adet problem ve o problemin çözümünde veri madenciliğinin kullanımını anlatır mısınız?

H. Takcı : Henüz doktora tezimi veri madenciliği alanında yapmamış olsaydım bu sorunun cevabı olarak meşhur “Pazar Sepeti” analizini size örnek olarak verirdim. Hani şu birlikte alınan ürünlerden yola çıkarak size market tasarımı konusunda öğüt veren analiz var ya işte o ama ben bana daha ilginç gelen doktora konumu anlatayım. Doktorada çalıştığım konu farklı dillerde yazılmış dokümanların otomatik olarak dillerine göre ayırt edilmesi. Normal şartlarda konu uzmanlarının yaptığı tasnif işlemini bilgisayar yapabilir mi sorusu ile başlayan sürecin sonunda gördük ki konu uzmanlarının yetersiz kaldığı noktada bilgisayarlar bize yardımcı olabilirmiş. Nasıl mı? Bir doküman paragraflardan, paragraflar cümlelerden, cümleler kelimelerden, kelimeler ise harflerden oluşur. Her bir doküman harf sıklıklarına göre bir vektör haline getirildikten sonra geriye kalan işlem sadece şu idi. Her bir dil için bir model inşa etmek ve dili bilinmeyen bir doküman geldiğinde modellerle karşılaştırarak dili bilinmeyen dokümanın dilini bulmak. Kullandığımız bilgi sadece kullanılan harflerin sıklığı, kullandığımız yöntem makine öğrenmesi algoritmalarıyla veri madenciliği, çıktı ise dil etiketleri oldu. 100 karakter gibi kısa metinlerde bile kurduğumuz model sayesinde 15 dilde %100 doğru tanıma oranlarını yakaladık. Şimdi düşünün 15 dili bilen bir uzman çalıştırsak dahi bilgisayar kadar hızlı bir tasnif yapamayacağı aşikardır.

B. Özdal : Tezinizi heyecanla anlatırken Makine Öğrenmesi gibi ilginç bir tabir kullandınız. Makine öğrenmesi nedir? Makineler de öğrenir mi?

H. Takcı : Evet, makinelerde öğrenir. Bir makinenin öğrenmesi şöyle oluyor. Adına eğitim verisi dediğimiz bir tutam veri adına öğrenme algoritması veya tümevarım yöntemi dediğimiz bir prosedür yardımıyla yoğrularak veriden bir model ortaya çıkıyor. Örneğin, geçmiş hava durumu verilerinden yola çıkarak hangi şartlarda yağmur yağacağına dair bir karar ağacı çıkarıyorsunuz. Geçmiş verilerden yola çıkarak karar ağacının meydana getirilmesi makinenin öğrenmesi oluyor. Öğrenen makine ilk kez karşılaşılan bir durumla kıyaslanarak da günün sonunda hava durumunun nasıl olacağını tahmin edebiliyorsunuz.

B. Özdal : Veri madenciliğinin gerçek hayatla ilişkisi sadece bilimsel çalışmalarda kullanılması mıdır yoksa bağ daha mı fazladır?

H. Takcı : Hani tecrübeli insan deriz ya, aslında veri madenciliği de yazılım ortamlarında tecrübe anlamına geliyor. Eldeki veriler veri madenciliği disiplini ile faydalı hale geliyor, deyim yerindeyse dile geliyor ve size yardımcı oluyor. Örneğin bir şirketin yıllar boyu dev gibi bir taraflarda depoladığı verilerin şirket için stratejik değeri yüksek bilgi olarak dönmesini düşünün.

B. Özdal : Hocam sizi yorduk farkındayız fakat son sorumuzu da sormadan sizi bırakmayalım. Veri madenciliği, makine öğrenmesi veya yapay zekâ bu alanlarda Sivas Cumhuriyet Üniversitesinin potansiyeli nedir? Konuyla ilgili firmalar veya meraklı öğrenciler olursa üniversite bu konuda destek olabilir mi?

H. Takcı : Bilgisayar Mühendisli Bölümümüz başta olmak üzere üniversitemizde bu alanda yeterli bilgi birikimi ve tecrübe olduğuna inanıyorum ben. Bölümümüzde görev yapan öğretim elemanlarımızın en az yarısının lisansüstü tezleri (yüksek lisans veya doktora) bu alanlarla ilgili. Ayrıca, okulumuzda üç ay önce kurduğumuz Yapay Zekâ ve Veri Bilimi Araştırma Merkezimiz bulunmakta olup bu merkeze bağlı 25 hocamız görev yapmaktadır. Rektörlüğümüzden ve projelerimizden aldığımız maddi manevi desteklerle daha iyi noktalara geleceğimizden şüphem yoktur.

B. Özdal : Konuyla ilgili merak edilenler için okuyucularımız sizinle iletişim kurabilirler mi?

H. Takcı : Elbette. Konuyla ilgili olarak fırsatı olanlar ofisimize gelebilirler. Olmayanlar ise [email protected] adresi üzerinden sorularını sorabilirler. Ayrıca https://verimadencisi.blogspot.com/ adresi üzerinde yer alan konuyla ilgili blog sitemizi takip edebilir veya http://hidayettakci.com/ adresinde yer alan kişisel sayfam üzerinden de çalışmalarımı takip edebilirler.

B. Özdal : Verdiğiniz değerli bilgiler için teşekkür ediyorum, başarılar diliyorum.

H. Takcı : Bu fırsatı verdiğiniz için ben teşekkür ediyorum. Sağ olun var olun.

Büyük Sivas Haber


buyuksivas.com "Basın Meslek İlkelerine" Uyar. AA ve İHA Abonesidir. Telefon : 0346 221 00 60 WhatsApp : 0555 898 15 58 - [email protected]