Veri madenciliği dersinde verilen bir ödevde algoritma kısmını kuramadım yardımcı olabilecek arkadaşlara teşekkürler. Ödev:12 değişkenden oluşan,1075 ayrı kayıttan oluşan bir ağ veri setidir. Bazı değişkenler sayısal değişkendir.Diğerleri ise nominal tipte kategorik değişkenlerdir.
"?" ile gösterilen değerler,kayıp değerlerdir. Öncelikle data preprocessing işlemlerini yapmanız beklenmektedir. Veri işleme,veri düzenleme,apriori vb ilişkin her türlü hazır fonksiyon,kütüphane kullanımı yasaktır.
Kullanıcı minimum support değerini girdikten sonra confidence lift veya average kısmını seçip değerini girdikten sonra kurallar ekrana gelmelidir. Ödevin özeti bu şekilde ben şu an regex ile sadece txt içeriğini okutabildim kayıp değerler ve kuralları nasıl çıkartacağım kısmında bir aklıma şu anlık bir şey gelmedi.
"?" değerleri için modunu almak istiyorum ilk sütünun bu kısımda ne yapabilirim ve verileri arrayliste attım liste atmam daha mı mantıklı olur fikirlerinizi bekliyorum teşekkürler
DH forumlarında vakit geçirmekten keyif alıyor gibisin ancak giriş yapmadığını görüyoruz.
Üye olduğunda özel mesaj gönderebilir, beğendiğin konuları favorilerine ekleyip takibe alabilir ve daha önce gezdiğin konulara hızlıca erişebilirsin.
Tek elemanli set, support arti kalanlar elenecek, sonra 2 elemanli set, support alti kalanlar elenecek, bu sekilde setlere kartezyen carpim uygulayip n elemana ulasincaya kadar gideceksin, ta ki support edilmeyinceye kadar.
A priori algoritmasinda variable, transaction, support gibi kavramlar olur. Degisken dedigi senin setinde tutacagin farkli "eleman" lar. Transaction, bu variablelarin hangi kombinasyonlarda bir arada yer aldigi. Support, kac defa gozlemledigin degiskenlerin senin icin onemli oldugu. ( Bir nevi statistically significant olup olmadigi ).
1 elemanli degiskenlerin transactionda gorulmesi ve support edilip edilmemesi --> L1 2 elemanli olanlarin ( L1 x L1 kartezyeni ; self join) support edilip edilmemesi ---> L2 ... Bu sekilde n elemana kadar gidip, bulabilecegin support edilebilen Ln kumesini hesaplaman gerekiyor. Regex ile yapamazsin, hashtable ve set kullanman gerekiyor.
Sonrasinda da Bayesian prob hesabindan, bir arada gorulen variable listesini inceleyip, variable1 varsa variable2 nin olma ihtimali x tir seklinde sonuclara ulasip birbiri ile alakali olan variable listesinin dokumunu vereceksin. Apriorinin yaptigi bu.
Dediklerim anlamsiz geliyorsa algoritmanin detaylarini incelemelisin, aslinda basit bir algoritma. Implemente etmesi de kolay sayilir.
< Bu mesaj bu kişi tarafından değiştirildi Mephalay -- 3 Kasım 2019; 19:21:56 >
Ödev:12 değişkenden oluşan,1075 ayrı kayıttan oluşan bir ağ veri setidir.
Bazı değişkenler sayısal değişkendir.Diğerleri ise nominal tipte kategorik değişkenlerdir.
"?" ile gösterilen değerler,kayıp değerlerdir.
Öncelikle data preprocessing işlemlerini yapmanız beklenmektedir.
Veri işleme,veri düzenleme,apriori vb ilişkin her türlü hazır fonksiyon,kütüphane kullanımı yasaktır.
Kullanıcı minimum support değerini girdikten sonra confidence lift veya average kısmını seçip değerini girdikten sonra kurallar ekrana gelmelidir.
Ödevin özeti bu şekilde ben şu an regex ile sadece txt içeriğini okutabildim kayıp değerler ve kuralları nasıl çıkartacağım kısmında bir aklıma şu anlık bir şey gelmedi.
Örnek veri seti=
Node,Full_Bandwidth,Average_Delay_Time_Per_Sec,Packet Size_Byte,Packet_Transmitted,Packet_lost,Transmitted_Byte,AVG-Drop-Rate,AVG-Bandwith-Use,Node Status,Flood Status,Class
9,900,0.000406,1440,81276,37843,117037440,0.35852,0.466776,P NB,0.136238,NB-Wait
9,900,0.000406,1440,81276,37843,117037440,0.35852,0.466776,P NB,0.136238,NB-Wait
9,900,0.000406,1440,81276,37843,117037440,0.35852,0.466776,P NB,0.136238,NB-Wait
?,800,0.00041,1440,72228,24509,104008320,0.254496,0.644112,B,0.050899,NB-Wait
. . .
"?" değerleri için modunu almak istiyorum ilk sütünun bu kısımda ne yapabilirim ve verileri arrayliste attım liste atmam daha mı mantıklı olur fikirlerinizi bekliyorum teşekkürler
DH forumlarında vakit geçirmekten keyif alıyor gibisin ancak giriş yapmadığını görüyoruz.
Üye Ol Şimdi DeğilÜye olduğunda özel mesaj gönderebilir, beğendiğin konuları favorilerine ekleyip takibe alabilir ve daha önce gezdiğin konulara hızlıca erişebilirsin.
< Bu mesaj bu kişi tarafından değiştirildi Basketball is my life -- 1 Kasım 2019; 15:32:32 >