Birliktelik Kuralları (Association Rules)

Birliktelik Kuralları (Association Rules) Nedir?

Birliktelik kuralları (Association Rules), büyük veri kümeleri arasında birliktelik ilişkileri bulan veri madenciliği yöntemlerinden biridir. Verilerin içerisinde birbiriyle ilişkili olan özelliklerin ortaya çıkarılarak, aralarındaki ilişkinin büyüklüğünün tespit edilmesine yöneliktir. Veri kümeleri içerisinde yapılan işlemler incelenerek kurallar belirlenmeye çalışılır. Kitap sitesindeki alışverişlerde “bunu alan kullanıcılar bunu da aldı” çıkarımları buna örnektir. Hangi ürünler birlikte satılıyor? Yeni bir ilaca duyarlı olan DNA tipleri hangileridir? sorgulamalarının yanıtı birliktelik kuralları çıkarımı ile mümkündür.

Örneğin bir müşteri çay alıyorsa, aynı alışverişte çayın yanında şeker alma olasılığı nedir? Bu şekildeki sorgulamalar ile raf düzenleri ayarlanarak satış oranları arttırılabilmektedir. Eğer çay alan kişiler, şeker de alıyorsa bu durumda çay ile şekerin yan yana raflarda olması satışı arttıracak bir düzenlemedir.

Özetle amacımız veri içindeki kuralları belirlemektir.

Burada karşımıza iki tane ölçüt çıkmaktadır. Destek ve güven ölçütleri.

Destek ve Güven Ölçütleri

Birliktelik çözümlemelerinin en yaygın uygulaması perakende satışlarda müşterilerin satın alma eğilimlerini belirlemek amacıyla yapılmaktadır. Müşterilerin bir anda satın aldığı tüm ürünleri ele alarak satın alma eğilimini ortaya koyan uygulamalara pazar sepet çözümlemesi denir.

Pazar sepet çözümlemelerinde satılan ürünler arasındaki ilişkileri ortaya koymak için bu iki ölçütten yararlanılır. Bu ölçütlerin hesaplanmasında destek sayısı adı verilen bir değer kullanılır. Destek ölçütü, tüm alışverişler içinde hangi oranda tekrarladığını belirler. Güven ölçütü A ürün grubunu alan müşterilerin B ürün grubunu da alma olasılığını ortaya koyar.

A ürün grubunu alanların B ürün grubunu alma olasılığı birliktelik kuralı olarak (AB) biçiminde gösterilir. Bu durumda kural destek ölçütü:

destek(AB) = sayı (A,B) / N

  • sayı(A,B) = A ve B ürün gruplarını birlikte içeren alışveriş sayısı
  • N = tüm alışverişlerin sayısı

şeklinde ifade edilir.

A ve B ürün gruplarının birlikte satın alınması olasılığını ifade eden kural güven ölçütü:

güven(AB) = sayı (A,B) / sayı (A)

TIDItems
1Bread, Milk
2Bread, Diaper, Tea, Eggs
3Milk, Diaper, Tea, Coke
4Bread, Milk, Diaper, Tea
5Bread, Milk, Diaper, Coke

Bu tablolar transaction’ları tutar ve bu tablolardan yola çıkılarak kurallar çıkarılmaya çalışılır. TID olarak belirtilen kısım transaction ID yani her bir yapılan işlem için kullanılan ID numaralarıdır.

Kural {Milk, Diaper} Tea

destek = sayı (Milk,Diaper,Tea) / N = 2/5 = 0.4

güven = sayı (Milk,Diaper,Tea) / sayı (Milk, Diaper) = 2/3 = 0.67

Birliktelik kuralları yöntemlerini uygulayabilmek için çeşitli algoritmalar vardır. Bir algoritmayı çalıştırmadan önce (örneğin apriori algoritması) güven aralığı, destek değeri ya da aralığı belirlenir. Belirlenen değerden aşağı olan değerler gösterilmez. Hesaplanan destek veya güven ölçütü ne kadar büyük ise birliktelik kuralları da o kadar güçlüdür.

Birliktelik Kuralları yöntemlerinden birisi olan Apriori Algoritmasını okumak için buraya tıklayabilirsiniz.

1 yorum
Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir