Apriori Algoritması Nedir?

Apriori Algoritması, birliktelik kuralları yöntemlerinden biridir. Apriori Algoritmasının ismi, bilgileri bir önceki adımdan elde ettiği için “prior (önceki)” anlamında Apriori’dir. Apriori Algoritması, özellikle çok büyük ölçekli veri tabanları üzerindeki veri madenciliği çalışmaları için geliştirilmiştir. Genel anlamda ilişki kuralı (association rule) çıkarımında kullanılan bir algoritmadır. Algoritmanın amacı, veri tabanlarında bulunan satırlar arasındaki bağlantıyı ortaya çıkarmaktır.

Algoritma, yapı olarak aşağıdan yukarıya (bottom-up) yaklaşımını kullanmakta olup her seferinde tek bir eleman incelemekte ve bu elemanla diğer adayların ilişkisini ortaya çıkarmaya çalışmaktadır.

Ayrıca algoritmanın her eleman için çalışmasını bir arama algoritmasına benzetmek mümkündür. Algoritma bu anlamda genişlik öncelikli arama (breadth first search) yapısında olup adayları birer ağaç (tree) olarak düşünerek bu ağaç üzerinde arıyor gibi düşünebiliriz.

Apriori Algoritması Adımları

  1. Minimum destek sayısı ve minimum güven değerinin belirlenmesi

  2. Öğe kümeler içerisindeki her bir öğenin destek değerinin bulunması

  3. Minimum destek değerinden daha küçük desteğe sahip olan öğelerin devre dışı bırakılması

  4. Elde edilen tekli birliktelikler dikkate alınarak ikili birlikteliklerin oluşturulması

  5. Minimum destek değerinden düşük olan öğe kümelerinin çıkartılması

  6. Üçlü birlikteliklerin oluşturulması

  7. Üçlü birlikteliklerden minimum destek değerinin altındakilerin çıkarılması

  8. Üçlü birlikteliklerden birliktelik kurallarının çıkarılması

Apriori Algoritması Örnek

1. Adım:

Çözümlemeye bazı varsayımlar ile başlanır. Destek ve güven ölçütleri için eşik değerleri belirlenir.

destek(eşik) = %60

güven(eşik) = %75

Destek (eşik) %60 ve müşteri sayısı 5 olduğuna göre Eşik Destek Sayısı = 0.60*5 =3‘tür.

2. Adım:

Ürünlerin her biri için destek değerini hesapla. (Ürünler baş harfleri ile gösterilmiştir.)

  • s(Ş) = 3
  • s(E) = 4
  • s(D) = 1
  • s(Z) = 1
  • s(Ç) = 2
  • s(M) = 4
  • s(K) = 1

3. Adım:

Eşik destek sayısından (e.d.s) küçük olanlar çıkartılır.

E.D.S < 3 çıkartılır

  • Şeker = 3
  • Ekmek = 4
  • Makarna = 4
  • Peynir = 4

4. Adım:

İkili ürün gruplarının destek değerleri belirlenir.

  • s(Ş,E) = 2
  • s(Ş,M) = 2
  • s(Ş,P) = 2
  • s(E,M) = 3
  • s(E,P) = 3
  • s(M,P) = 4

5. Adım:

Eşik destek sayısından (e.d.s) küçük olanlar çıkartılır.

E.D.S < 3 çıkartılır

  • s(E,M) = 3
  • s(E,P) = 3
  • s(M,P) = 4

6. Adım:

Çözümlemeye katılacak ürünler belirlendiğine göre, bu ürünlerle üçlü gruplar oluşturulur.

  • s(E,M,Ş) = 1
  • s(E,M,Ç) = 1
  • S(E,M,P) = 3
  • s(E,P,S) = 1
  • s(E,P,D) = 1
  • s(M,P,Ş) = 2
  • s(M,P,Ç) = 1

7. Adım:

Eşik destek sayısından (e.d.s) küçük olanlar çıkartılır.

E.D.S < 3 çıkartılır

  • S(E,M,P) = 3

8. Adım: Birliktelik Kurallarının Bulunması

sayı (A,B) = sayı (E,M,P) = 3

destek (AB) = s(E,M,P) / N = 3/5 = 0.6

Bu şekilde kural destek ölçütü elde edilir. Bu destek ölçütü koşul olarak verdiğimiz eşik değerden küçük değildir. O halde bu nesne kümesini kullanabileceğimiz anlaşılır. Birliktelik kuralları türeterek bu kurallar için güven ölçütleri elde edilir.

SONUÇ 1

güven (E,MP) = S(E,M,P) / s(E,M) = 3/3 = %100

SONUÇ 2

güven (EM,P) = S(E,M,P) / s(E) = 3/4 = %75

SONUÇ 3

güven (PE,M) = S(E,M,P) / s(P) = 3/4 = %75

SONUÇ 4

güven (ME,P) = S(E,M,P) / s(M) = 3/3 = %75

Birliktelik KuralıGüven
E,M P%100
E P,M%75
P E,M%75
M E,P%75

Bu tabloyu şu şekilde okumalıyız. Örneğin ilk satıra bakacak olursak E,M → P, ekmek ve makarnanın bulunduğu ürün kümesinde peynirin olma olasılığı %100’müş. Yani ekmek ve makarna alan herkes peynir de almış. Alttaki satırları da bu şekilde okuyabilirsiniz.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir