Algoritma Apriori

Diposting pada

Association Rule (Algoritma A Priori)

Algoritma Apriori Association Rule – Contoh, Metode & AnalisisPensil.Co.Id – Algoritma A Priori termasuk jenis aturan asosiasi pada data mining. Selain a priori, yang termasuk pada golongan ini adalah metode generalized rule induction dan algoritma hash based. Aturan yang menyatakan asosiasi antara beberapa atribut sering disebut affinityanalysis atau market basketanalysis.

Metodologi dasar analisis asosiasi terbagi menjadi dua tahap:


Analisa Pola Frekuensi Tinggi

Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database. Nilai support sebuah item diperoleh dengan rumus berikut:

Analisa pola frekuensi tinggi


Pembentukan Aturan Assosiatif

Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan assosiatif A ->B. Nilai confidence dari aturan A ->B diperoleh dari rumus berikut:

Pembentukan aturan assosiatif


Contoh, ada transaksi seperti yang dilihat di bawah ini:

Contoh Transaksi

  • Pisahkan masing-masing item yang dibeli

Item yang dibeli

  • Kemudian Buat Tabel seperti di bawah ini dan hitung jumlahnya:

Buat Tabel transaksi


  • Tentukan Ф

Misalkan kita tentukan Ф = 3, maka kita dapat menentukan frekuen itemset. Dari tabel di atas diketahui total Ф untuk transaksi k = 1, semuanya lebih besardari Ф. Maka:F1= {{A}, {B}, {C}, {D}, {E}}Untuk k = 2 (2 unsur), diperlukan tabel untuk tiap-tiap pasang item. Himpunan yang mungkin terbentuk adalah: {A,B}, {A,C}, {A,D}, {A,E}, {B,C}, {B,D}, {B,E}, {C,D}, {C,E}, {D,E}.


Tabel-tabel untuk calon 2 item set

Tabel-tabel untuk calon 2 item set


Dari tabel-tabel 2 unsur di atas, P artinya item-item yang dijual bersamaan, sedangkan S berarti tidak ada item yang dijual bersamaan atau tidak terjadi transaksi. Σ melambangkan jumlah Frekuensi item set. Jumlah frekuensi item set harus lebih besar atau sama dengan jumlah Frekuensi item set (Σ >= Ф). Dari tabel diatas, maka didapat:

Baca Juga :  Pengertian Manajemen Produksi Dan Contoh, Fungsi, Tujuan Serta Aspeknya

F2 = {{C,D},{C,E},{D,E}}

Kombinasi dari itemset dalam F2, dapat kita gabungkan menjadi calon 3-itemset. Itemset-itemset yang dapat digabungkan adalah itemset-itemset yang memiliki kesamaan dalam k-1 item pertama. Untuk k = 3 (3 unsur), himpunan yang mungkin terbentuk adalah: {C,D,E}

kesamaan dalam k-1


Dari tabel-tabel di atas, didapat F3= { }, karena tidak ada Σ >= Ф sehingga F4, F5, F6 dan F7 juga merupakan himpunan kosong.

  • Tentukan (ss-s) sebagai antecedent dan s sebagai consequent dari Fk yang telah didapat. Pada F2 didapat himpunan F2= {{C,D},{C,E},{D,E}}


Maka dapat disusun:

  • Untuk {C,D}:
  1. Jika (ss-s) = C, Jika s = D, Maka →If buy C then buy D
  2. Jika (ss-s) = D, Jika s = C, Maka →If buy D then buy C
  • Untuk {C,E}:
  1. Jika (ss-s) = C, Jika s = E, Maka →If buy C then buy E
  2. Jika (ss-s) = E, Jika s = C, Maka →If buy E then buy C
  • Untuk {D,E}:
  1. Jika (ss-s) = D, Jika s = E, Maka →If buy D then buy E
  2. Jika (ss-s) = E, Jika s = D, Maka →If buy E then buy D

  • Dari langkah di atas, kita mendapatkan 6 rule yang dapat digunakan, yaitu:

  1. If buy C then buy D
  2. If buy D then buy C
  3. If buy C then buy E
  4. If buy E then buy C
  5. If buy D then buy E
  6. If buy E then buy D
  • Hitung support dan confidence

Hitung support dan confidence

 


Sehingga didapat table sebagai berikut:

Hitung support dan confidence

  • Setelah di dapat support dan confidence untuk masing-masing kandidat, lakukan perkalian antara support dan confidence, dimana confidence-nya diambil 70% ke atas, sehingga di dapat tabel sbb:

support dan confidence


  • Setelah didapat hasil perkalian antara support dan confidence, pilihlah yang hasil perkaliannya paling besar. Hasil paling besar dari perkalian perkalian tersebut merupakan rule yang dipakai pada saat menjual. Karena hasil perkalian dari ke-2 penjualan di atas bernilai sama, maka semuanya bisa dijadikan rule.

  1. Jika membeli E maka akan membeli C dengan support 42,86% dan confidence 75%
  2.  Jika membeli E maka akan membeli D dengan support 42,86% dan confidence 75%

  • Pengertian Algoritma Apriori

Algoritma apriori merupakan salah satu algoritma klasik data mining. Algoritma apriori digunakan agar komputer dapat mempelajari aturan asosiasi, mencari pola hubungan antar satu atau lebih item dalam suatu dataset.


Algoritma apriori banyak digunakan pada data transaksi atau biasa disebut market basket, misalnya sebuah swalayan memiliki market basket, dengan adanya algoritma apriori, pemilik swalayan dapat mengetahui pola pembelian seorang konsumen, jika seorang konsumen membeli item A , B, punya kemungkinan 50% dia akan membeli item C, pola ini sangat signifikan dengan adanya data transaksi selama ini.

Baca Juga :  Tujuan Organisasi Adalah

Penting tidaknya suatu aturan assosiatif dapat diketahui dengan dua parameter, support (nilai penunjang) yaitu persentase kombinasi item tersebut dalam database dan confidence (nilai kepastian) yaitu kuatnya hubungan antar item dalam aturan assosiatif.


Aturan assosiatif biasanya dinyatakan dalam bentuk : {roti, mentega} -> {susu} (support = 40%, confidence = 50%)
Yang artinya : “Seorang konsumen yang membeli roti dan mentega punya kemungkinan 50% untuk juga membeli susu. Aturan ini cukup signifikan karena mewakili 40% dari catatan transaksi selama ini.”


Analisis asosiasi didefinisikan suatu proses untuk menemukan semua aturan assosiatif yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk confidence (minimum confidence).


Tetapi di lain pihak Apriori memiliki kelemahan karena harus melakukan scan database setiap kali iterasi, sehingga waktu yang diperlukan bertambah dengan makin banyak iterasi. Masalah ini yang dipecahkan oleh algoritma-algoritma baru seperti FP-growth.


  • Contoh Pemakaian Hasil dari Mempelajari Aturan Asosiasi

  • Meletakkan barang-barang yang sering dibeli bersamaan dengan posisi berdekatan atau mudah dijangkau sehingga diharapkan pembeli membeli barang lebih banyak. Cara ini dikembangkan oleh Wal-Mart yang merupakan salah satu pasar swalayan populer di Amerika. Saat itu Wal-Mart menganalisis data yang dimilikinya, dan menemukan bahwa pada hari Jumat sore, pembeli laki-laki yang membeli popok, ternyata cenderung membeli bir. Dari hasil temuan tersebut, Wal-Mart menempatkan bir di dekat tempat penjualan popok, dan alhasil penjualan bir meningkat. Kasus ini menjadi terkenal, karena sebelumnya banyak yang tidak menduga akan ampuhnya data mining.

  • Amazon.com, mengembangkan perekomendasi (recommender), yaitu sebuah program untuk merekomendasikan barang-barang lain kepada pembeli pada saat pembeli melakukan browsing atau membeli suatu barang berdasarkan tingkat keyakinan (confidence).

amazon asosiasi
Amazon Asosiasi

  • Google mengembangkan fitur auto-complete, yaitu saat pemakai mengetikkan suatu kata, program akan menampilkan daftar kata-kata berikutnya, yang paling banyak memiliki asosiasi pada kata yang diketik

Definisi-Definisi yang Terdapat Pada Association Rule

  • E adalah himpunan yang tengah dibicarakan. Contoh: {Asparagus, Beans, …, Tomatoes}
  • D adalah Himpunan seluruh transaksi yang tengah dibicarakan. Contoh: {Transaksi 1, transaksi 2, …, transaksi 14}
  • Proper Subset adalah Himpunan Bagian murni. Contoh:

Ada suatu himpunan A={a,b,c,}

  • Himpunan Bagian dari A adalah
  • Himpunan Kosong = {}
  • Himpunan 1 Unsur = {a},{b},{c}
  • Himpunan 2 Unsur = {a,b},{a,c},{b,c}
  • Himpunan 3 Unsur = {a,b,c,}

Proper subset nya adalah Himpunan 1 Unsur dan Himpunan 2 Unsur

  • Item set adalah Himpunan item atau item-item di E. Contoh:
Baca Juga :  Pengertian Perserta Didik Dalam Pendidikan Dan Istilahnya

Ada suatu himpunan E={a,b,c,}, Item set nya adalah {a};{b}:{c};{a,b};{a,c};{b,c}

  • K- item set adalah Item set yang terdiri dari K buah item yang ada pada E. Intinya K itu adalah jumlah unsur yang terdapat pada suatu Himpunan. Contoh: 2-item set adalah yang bersifat 2 unsur {a,b},{a,c},{b,c}.
  • Item set Frekuensi adalah Jumlah transaksi di I yang mengandung jumlah item set tertentu. Intinya jumlah transaksi yang membeli suatu item set. Contoh:

Kita gunakan tabel transaksi penjualan sayur di atas

  1. frekuensi Item set yang sekaligus membeli Beans dan Brocolli adalah 3
  2. frekuensi item set yang membeli sekaligus membeli Beans, Squash dan Tomatoes adalah 2.
  • Frekuen Item Set adalah item set yang muncul sekurang-kurangnya “sekian” kali di D (minimum support). Kata “sekian” biasanya di simbolkan dengan Ф. Ф merupakan batas minimum dalam suatu transaksi.
  • Fk atau K-itemset adalah himpunan semua frekuen Item Set yang terdiri dari K item, misalnya beras,telur,minyak adalah 3-itemset (Dinotasikan sebagai K-itemset)

Langkah atau Cara Kerja Apriori

  1. Tentukan minimum support.
  2. Iterasi 1 : hitung item-item dari support(transaksi yang memuat seluruh item) dengan men-scan database untuk 1-itemset, setelah 1-itemset didapatkan, dari 1-itemset apakah diatas minimum support, apabila telah memenuhi minimum support, 1-itemset tersebut akan menjadi pola frequent tinggi.
  3. Iterasi 2 : untuk mendapatkan 2-itemset, harus dilakukan kombinasi dari k-itemset sebelumnya, kemudian scan database lagi untuk hitung item-item yang memuat support. itemset yang memenuhi minimum support akan dipilih sebagai pola frequent tinggi dari kandidat.
  4. Tetapkan nilai k-itemset dari support yang telah memenuhi minimum support dari k-itemset.
  5. Lakukan proses untuk iterasi selanjutnya hingga tidak ada lagi k-itemset yang memenuhi minimum support.

Formula Pencarian Nilai Support & Confidence

Nilai support sebuah item diperoleh dengan rumus berikut:

Formula Pencarian Nilai Support & Confidence

support-A

Sedangkan nilai support dari 2 item diperoleh dari rumus berikut:

support-AUB

support-AUB


Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan assosiatif A -> B. Nilai confidence dari aturan A -> B diperoleh dari rumus berikut:

confidence-A-B

confidence-A-B


Demikianlah penjelasan artikel diatas tentang Algoritma Apriori Association Rule – Contoh, Metode & Analisis semoga dapat bermanfaat bagi pembaca setia DosenPendidikan.Com