Analisis dan Implementasi Correlated Multi-label Feature Selection dalam Artikel Berita Bahasa Indonesia

Awalia Windarsari Putri

Informasi Dasar

113081003
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Pada data artikel berita umumnya memiliki label lebih dari satu yang dikenal dengan multi-label. Dalam multi-label sendiri terdapat dua permasalahan utama, yaitu label saling berkorelasi dan juga saling interdependent satu sama lain dan data memiliki dimensionalitas yang tinggi. Untuk menangani masalah dimensionalitas tinggi dapat diterapkan feature selection, sedangkan untuk melakukan feature selection pada kasus ini juga harus memperhatikan korelasi antar atributnya yang disebut dengan Correlated Multi-label Feature Selection (CMLFS), salah satu metode feature selection. Feature selection yang dilakukan berdasarkan nilai koefisien korelasi yang terbagi dalam korelasi tinggi dan korelasi rendah. Untuk mengetahui pengaruh dari CMLFS diperlukan proses klasifikasi dengan menggunakan metode klasifikasi Support Vector Machine (SVM). Penilaian performansi dievaluasi dengan menggunakan akurasi pengujian dan juga waktu klasifikasi. Hasilnya setelah dilakukan feature selection korelasi rendah maupun korelasi tinggi umumnya menunjukkan terjadinya penurunan akurasi, tetapi waktu klasifikasi akan semakin cepat, dikarenakan semakin sedikitnya atribut yang ada.Kata Kunci : feature selection, Support Vector Machine, multi-label, korelasi, correlated multi-label feature selectionABSTRACT: In news article, generally has more than one label, known as multi-label. In multi-label itself there are two main issues, namely the labels are correlated and interdependent with each other and the data has high dimensionality. To address the problem of high dimensionality can be applied to feature selection, while for feature selection in this case must also consider the correlation between attributes is called the Correlated Multi-label Feature Selection (CMLFS), one of feature selection method. The Feature selection is done based on a correlation coefficient within attribute, divided into high and low correlation. To determine the effect of CMLFS, the classification process is required, using the method of classification Support Vector Machine (SVM). Assessment of the performance was evaluated using the testing accuracy and classification time. The result after feature selection based on high and low correlations generally showed a decrease in accuracy, but the classification time will be faster, because the number of attributes getting smaller.Keyword: feature selection, Support Vector Machine, multi-label, correlation, correlated multi-label feature selection

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Analisis dan Implementasi Correlated Multi-label Feature Selection dalam Artikel Berita Bahasa Indonesia
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Awalia Windarsari Putri
Perorangan
Deni Saepudin, Intan Nurma Yulita
 

Penerbit

Universitas Telkom
Bandung
2012

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini