Analisis dan Implementasi Algoritma ReliefF untuk Feature Selection pada Klasifikasi Dataset Multiclass

Danang Aji Irawan

Informasi Dasar

113070262
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Permasalahan yang terjadi pada data adalah jumlah yang terlalu banyak. Salah satunya adalah pada jumlah atribut yang ada dalam data tersebut. Untuk menanganinya , kita perlu melakukan reduksi data pada dimensi atribut. Teknik ini biasanya disebut dengan Feature Selection atau pemilihan atribut. Teknik ini merupakan salah satu dari teknik yang dilakukan pada data preprocessing. Tujuan melakukan feature selection ini, selain untuk mereduksi jumlah atribut, nantinya bisa memberikan performansi yang lebih baik pada saat melakukan klasifikasi dibandingkan menggunakan data yang tidak dilakukan pemilihan atribut.
Pada Tugas Akhir ini, penulis mengimplementasikan salah satu algoritma feature selection yaitu ReliefF. Algortima ini merupakan algoritma pemilihan atribut yang berbasis pada instan atau record. Pemilihan atribut dilakukan dengan menghitung perbedaan bobot untuk tiap instan yang terpilih secara acak (random sampling) dengan instan yang terpilih sebagai near hit (tetangga terdekat instan terpilih pada kelas yang sama) dan near miss (tetangga terdekat instan terpilih pada kelas yang berbeda).
Tahap penghitungan performansi akan didasarkan pada data baru yang berisi data dengan atribut yang terpilih untuk kemudian dilakukan proses klasifikasi. Dari proses klasifikasi ini, akan dihitung perbedaan performansi dari data yang belum dilakukan pemilihan fitur dengan yang telah dilakukan proses pemilihan fitur. Hasil yang ditangkap adalah nilai dari precission dan recall.
Hasil implementasi, pengujian, dan analisis pada Tugas Akhir ini menunjukkan bahwa kinerja algoritma ini sangat bergantung pada jumlah iterasi yang dilakukan, jumlah tetangga terdekat, penentuan threshold, dan juga kualitas instan yang terpilih secara acak saat algoritma ini dijalankan. Dataset yang telah mengalami proses pemilihan fitur telah mampu meningkatkan performansi hasil klasifikasi.
Kata Kunci : feature selection, ReliefF, klasifikasi, near hit, near missABSTRACT: Problems that occurred in the data is the amount that is too big. One of the problem is the number of attributes that exist in the data. To handle the problem, we need to make data reduction on dimension of attribute. This technique is called Feature Selection. This technique is one of the techniques performed on the data preprocessing. The purpose of doing feature selection, in addition to reducing the number of attributes, will be able to give a better performance of classification when we compared to data that without attribute selection.
In this research, the author implements a feature selection algorithm called ReliefF. This algorithm is attribute selection algorithm that based in instance. The selection attributes is done by calculating differences weight for each instance with selected by randomly as near hit (nearest neighbor was elected in the same class) and near miss (nearest neighbor was elected in the different class).
Calculation of performance will be based on new data that contains data with attribute that are selected from feature selection for the classification. From the classification process, difference of performance will be calculated the data that has not been done with the selection of features that have made the process of selection of features. Results are captured the value of precision and recall.
The results of the implementation, testing, and analysis on this Final Project shows that the performance of the algorithm is highly dependent on the number of iterations performed, the number of nearest neighbors, election of threshold and also the quality of the randomly selected instant when the algorithm is run. Dataset that has undergone a process of selection of features has been able to improve the performance of the classification results.
Keyword: feature selection, ReliefF, classification, near hit, near miss.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Analisis dan Implementasi Algoritma ReliefF untuk Feature Selection pada Klasifikasi Dataset Multiclass
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Danang Aji Irawan
Perorangan
Z.K. Abdurahman Baizal, Erda Guslinar Perdana
 

Penerbit

Universitas Telkom
Bandung
2011

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini