CONFIDENCE VALUE ANALYSIS OF FP-GROWTH ALGORITHM ON ORACLE RDBMS USING SET THEORY AND UNSUPERVISED LEARNING

Boby Siswanto

Informasi Dasar

112 kali
213120002
006.312
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Hal yang dijadikan acuan pada association rule mining adalah nilai support dan nilai confidence.
Semakin tinggi nilai support dan nilai confidence maka semakin baik rules yang dihasilkan.
Algoritma association rule mining menerapkan unsupervised learning dimana rule yang dihasilkan
tidak ditentukan untuk menjadi class tertentu. Performansi algoritma association rule mining
sangat bergantung pada ukuran dataset /dimensi yang digunakan. Performansi dapat di ukur dari
waktu pemrosesan yang dihasilkan. Semakin besar dataset maka dimensinya akan semakin besar
dan waktu pemrosesan akan semakin lama. Jika dimensi dapat disusutkan maka waktu proses
akan semakin cepat sehingga performansi semakin baik, dengan catatan nilai confidence relatif
tidak berubah.

Intersection merupakan jenis dari teori himpunan yang dapat mengurangi jumlah atribut pada 2
atau lebih himpunan yang berelasi. Oracle merupakan salah satu RDBMS, himpunan yang
berelasi dapat diterapkan pada Oracle RDBMS sebagai tabel-tabel yang berelasi. IST-EFP
algorithm adalah proposed algoritma yang mengkombinasikan algoritma EFP (Expand FP-
Growth) dengan teori himpunan.

Pada penelitian ini algoritma IST-EFP dapat menyusutkan dimensi dari dataset sampai 87.5%
dengan perbaikan waktu proses 26.6%. Nilai confidence yang dihasilkan relatif tidak berubah,
contoh rule FP-18  FKUE72 sebelumnya memiliki nilai confidence 23.4%, dengan algoritma
IST-EFP menjadi 23.41%.

Hasil-hasil yang didapatkan dapat digunakan untuk menentukan business actions.KATA KUNCI: association rule mining, unsupervised learning, confidence value, IST-EFP algorithm, dataset, set theory, pruned, intersections, Oracle RDBMS, business actions.ABSTRACT: Values used as a reference of the association rule mining are support value and confidence value.
The higher the value the support and confidence value, the better the resulting rules. Association
rule mining algorithms apply unsupervised learning because the resulting rule is not determined to
rule mining algorithms apply unsupervised learning because the resulting rule is not determined to
be a certain class. Performance of association rule mining algorithms rely heavily on the dataset
size / dimensions are used. Performance can be measured from the time processing is generated.
The larger the dataset, the dimensions will be greater and the processing time will be longer. If the
dimensionality of dataset can be pruned, the processing time will be faster and the performance
will be better, with confidence values relatively unchanged.

Intersection is a kind of set theory that can reduce the number of attributes on related sets. Oracle
is one of the RDBMS, related sets can be applied to the Oracle RDBMS as the related tables. IST-
EFP algorithm is a proposed algorithm that combines the EFP (Expand FP-Growth) with set
theory.

In this study, IST-EFP algorithm can reduce the dimension of the dataset to 87.5% with a 26.6%
improvement on time processing. The confidence value obtained was relatively unchanged, as an
example of FP-18  FKUE72 rule, previously the rule have 23.4% confidence value, after IST-
EFP implemented confidence value change to 23.41%.

This results can be used for business actions.KEYWORD: association rule mining, unsupervised learning, apriori, fp-growth, dataset, set theory, pruned, intersections, Oracle RDBMS, business actions.

Subjek

DATA MINING
 

Katalog

CONFIDENCE VALUE ANALYSIS OF FP-GROWTH ALGORITHM ON ORACLE RDBMS USING SET THEORY AND UNSUPERVISED LEARNING
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Boby Siswanto
Perorangan
Prof. Dr. The Houw Liong , Shaufiah
 

Penerbit

Universitas Telkom
Bandung
2014

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini