Implementasi dan Analisis Metode Clustering-based Missing Value Imputation (CMI)

Imam Arbianto Wicaksono

Informasi Dasar

141 kali
113070103
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Missing value adalah kondisi pada data dimana data tersebut memiliki nilai atribut yang tidak lengkap atau hilang. Missing value pada data dapat ditangani dalam berbagai cara, salah satunya adalah imputasi missing value sehingga didapat nilai yang cocok untuk mengisi missing value. CMI ( Cluster-based Missing Value Imputation ) adalah salah satu metode missing value imputation pada data numerik yang berbasiskan klaster. CMI akan mengklasterkan data menggunkan K-means clustering kemudian akan mengisi missing value dengan bantuan fungsi kernel berdasarkan nilai-nilai yang ada pada klaster dimana missing value tersebut berada. Fungsi kernel pada CMI bertujuan untuk menangani non-parametric imputation dimana data tersebut dianggap tidak dapat diregresikan secara umum. CMI dapat menangani missing value dengan tingkat akurasi yang baik dilihat dari hasil RMSE pada pengujian langsung dan F-measure pada performansi klasifikasi pengujian tidak langsung yang didapatkan.

Kata Kunci : missing value, klaster, numerik, CMI, non-parametricABSTRACT: Missing value is the condition on the data where the data has a value attribute that is incomplete or missing. Missing values in the data can be handled in different ways, one of which is the imputation of missing values so obtained are suitable for filling the missing value. CMI (Cluster-based Missing Value Imputation) is one of the missing value imputation methods of numerical data based on clusters. The data will be clustered by CMI use K-means clustering and then will fill in missing values with the help of kernel functions based on the values that exist in clusters in which the missing value is located. Kernel function in CMI aims to address non-parametric imputation where the data is not considered to be regressed in general. Tests performed were divided into two parts, namely the direct testing and indirect testing. Direct testing performed by calculating the RMSE of the estimates used to fill in missing values to actual values. Indirect testing is done by calculating F-measure of the classification results of test data on the actual class of data prior to testing. CMI can handle missing values with a relatively good level of accuracy seen from the results of RMSE and F-measure is obtained.

Keyword: missing value, cluster, numerical , CMI, non-parametric

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Implementasi dan Analisis Metode Clustering-based Missing Value Imputation (CMI)
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Imam Arbianto Wicaksono
Perorangan
Shaufiah, Imelda Ataina
 

Penerbit

Universitas Telkom
Bandung
2012

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini