Association Rule Learning

association rule learning

Association Rule Learning adalah jenis unsupervised learning yang memeriksa ketergantungan dari satu item data pada item data lain dan memetakannya agar lebih berguna. Association Rule Learning mencoba menemukan beberapa hubungan atau asosiasi yang menarik antar-fitur dari suatu dataset. Hal ini didasarkan pada aturan yang berbeda untuk menemukan hubungan yang menarik antar-fitur dalam suatu database.

Association Rule Learning adalah salah satu konsep Machine Learning yang sangat penting dan banyak digunakan dalam Market Basket Analysis, data mining, produksi berkelanjutan (continuous production), dll. Di sini Market Basket Analysis adalah teknik yang digunakan oleh berbagai bisnis retail untuk menemukan hubungan antar item. Kita bisa memahaminya dengan mengambil contoh supermarket, seperti di supermarket, semua produk yang dibeli disatukan.

Misalnya, jika pelanggan membeli roti, kemungkinan besar pelanggan juga dapat membeli mentega, telur, atau susu, sehingga produk ini disimpan di dalam rak atau sebagian besar di dekatnya.

market-basket-analysis

Association Rule Learning terbagi menjadi 3 jenis algoritma:

  • Apriori
  • Eclat
  • FP Growth (Frequent Pattern Mining)

Cara Kerja Association Rule Learning

Association Rule Learning bekerja pada konsep Pernyataan If dan Else, seperti jika A maka B.

Di sini elemen if disebut antecedent, dan pernyataan kemudian disebut konsekuensi. Jenis hubungan di mana kita dapat menemukan beberapa asosiasi atau hubungan antara dua item dikenal sebagai kardinalitas tunggal. Ini semua tentang membuat aturan, dan jika jumlah item meningkat, maka kardinalitas juga meningkat. Jadi, untuk mengukur hubungan antara ribuan item data, ada beberapa metrik. Metrik ini diberikan di bawah ini:

  • Support
  • Confidence
  • Lift

Support

Support adalah frekuensi A atau seberapa sering item muncul dalam dataset. Didefinisikan sebagai pecahan dari transaksi T yang berisi itemset X. Jika terdapat X datasets, maka untuk transaksi T dapat diformulasikan sebagai:

Supp(X) = Frekuensi(X) / T

Confidence

Confidence menunjukkan seberapa sering aturan itu terbukti benar. Atau seberapa sering item X dan Y muncul bersamaan dalam dataset ketika kemunculan X sudah diberikan. Ini adalah rasio transaksi yang berisi X dan Y dengan jumlah record yang berisi X.

Confidence(X) = Frekuensi(X, Y) / Frekuensi(X)

Lift

Ini adalah kekuatan aturan apa pun, yang dapat didefinisikan sebagai diformulasikan sebagai:

Lift = Supp(X, Y) / Supp(X)

Ini adalah rasio ukuran dukungan yang diamati dan dukungan yang diharapkan jika X dan Y independen satu sama lain. Ini memiliki tiga kemungkinan nilai:

Kondisi :

  • Kalau Lift=1 : Probabilitas kemunculan antecedent dan consequent tidak tergantung satu sama lain.
  • Kalau Lift>1: Ini menentukan sejauh mana dua itemset bergantung satu sama lain.
  • Kalau Lift<1: Ini memberitahu kita bahwa satu item adalah pengganti item lain, yang berarti satu item memiliki efek negatif pada yang lain.

Jenis Association Rule Learning

Association Rule Learning dapat dibagi menjadi 3 jenis algoritma:

Algoritma Apriori

Apriori menggunakan kumpulan data yang sering digunakan untuk menghasilkan aturan asosiasi. Ini dirancang untuk bekerja pada database yang berisi transaksi. Algoritma ini menggunakan pencarian luas-pertama dan Hash Tree untuk menghitung itemset secara efisien.

Ini terutama digunakan untuk analisis keranjang pasar dan membantu memahami produk yang dapat dibeli bersama. Ini juga dapat digunakan di bidang perawatan kesehatan untuk menemukan reaksi obat untuk pasien.

algoritma apriori

Algoritma Eclat

Eclat adalah singkatan dari Equivalence Class Transformation. Algoritma ini menggunakan teknik depth-first search untuk menemukan frequent itemset dalam database transaksi. Ia melakukan eksekusi lebih cepat daripada Algoritma Apriori.

algoritma eclat

Algoritma FP-Growth

FP-Growth adalah singkatan dari Frequent Pattern, dan ini adalah versi perbaikan dari Algoritma Apriori. Ini mewakili database dalam bentuk struktur data pohon yang dikenal sebagai pola atau pohon dari frekuensi data tersebut. Tujuan dari frequent tree ini adalah untuk mengekstraksi pola dengan frekuensi yang paling sering.

algoritma fp growth

Aplikasi Association Rule Learning

Ini memiliki berbagai aplikasi dalam pembelajaran mesin dan penambangan data. Di bawah ini adalah beberapa aplikasi populer dari pembelajaran aturan asosiasi:

  • Market Basket Analysis : Ini adalah salah satu contoh populer dan aplikasi Association Rule Mining. Metode ini banyak digunakan oleh binis retail untuk menentukan hubungan antar item.
  • Diagnosis Medis : Dengan bantuan aturan asosiasi, pasien dapat disembuhkan dengan mudah, karena membantu dalam mengidentifikasi kemungkinan penyakit bergantung dengan penyakit tertentu.
  • Urutan Protein : Algoritma Association Rule dapat membantu dalam menentukan sintesis protein buatan.
  • Desain Katalog dan Analisis Loss-Leader dan banyak lagi aplikasi lainnya.

Sejarah

Konsep di balik Association Rule Learning ditemukan kembali sebelumnya, association rule mining didefinisikan pada tahun 1990-an, ketika ilmuwan komputer bernama Rakesh Agrawal, Tomasz Imieliński dan Arun Swami mengembangkan cara algoritma bisa menemukan hubungan antar item menggunakan untuk menemukan titik penjualan (sistem POS). Algoritma ini pertama diterapkan di bisnis retail, dan para ilmuwan dapat menemukan hubungan antara berbagai barang yang dibeli, yang disebut association rule, yang pada akhirnya menggunakan informasi itu untuk memprediksi kemungkinan produk berupa probabilitas yang berbeda dibeli oleh customer sebelumnya.

Untuk bisnis retail, association rule mining memiliki cara untuk lebih memahami perilaku/pola pembelian pelanggan. Karena asalnya yang retail, association rule mining sering disebut sebagai Market Basket Analysis.

Seiring kemajuan dalam AI dan Machine Learning, telah terjadi sejak kasus penggunaan asli untuk association rule dan lebih banyak perangkat yang menghasilkan data. Association rule dapat digunakan dalam kasus penggunaan yang lebih luas. Semakin banyak data yang dihasilkan, berarti lebih banyak aplikasi yang akan menggunakan association rule. AI dan Machine Learning memungkinkan kumpulan data yang lebih besar dan lebih kompleks untuk dianalisis dan mining untuk association rule.

Tinggalkan Komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *