Analisis Penanganan Missing Value dengan Metode Robust Least Squares Estimation with Principal Component (RLSP)

Prima Arti Hastuti

Informasi Dasar

113070019
004
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Pada Tugas Akhir ini membahas mengenai salah satu cara penanganan missing value (MV) yaitu imputasi. Imputasi merupakan proses mengisi missing value secara otomatis dengan menggunakan algoritma tertentu. Metode imputasi yang digunakan dalam Tugas Akhir ini adalah Robust Least Squares Estimation with Principal Component (RLSP). Metode RLSP merupakan salah satu metode imputasi berbasis ketetanggan dan regresi. Proses imputasi dengan metode RLSP meliputi 3 tahap yaitu proses pemilihan k-nearest instance, proses Principal Component Analysis (PCA) dan proses estimasi MV berdasarkan hasil regresi median.

Berdasarkan parameter Normalized Root Mean Squared Error (NRMSE) dan hasil klasifikasi data hasil imputasi, metode RLSP mampu menebak nilai MV mendekati nilai aktualnya. Performansi metode ini dipengaruhi oleh jumlah k-nearest instance dan Principal Component (PC). Jumlah k-nearest instance dan Principal Component (PC) optimal dicapai ketika data set memiliki variansi kecil dan record-record yang terpilih sebagai pengestimasi memiliki kemiripan yang tinggi dengan record ber-MV. Principal Component Analysis yang diterapkan dalam metode ini membuat metode ini cocok apabila digunakan pada data yang memiliki dimensi yang sangat besar. Selain itu, meskipun data mengandung outlier sampai 10%, metode ini masih mampu menebak nilai MV dengan baik.

Kata Kunci : missing value, Robust Least Squares Estimation with Principal Component (RLSP), outlier,ABSTRACT: One way of handling missing value (MV) is imputation. Imputation is the process of filling missing value automatically using a specific algorithm. Imputation method is used in this Final Project is Robust Least Squares Estimation with Principal Component (RLSP). RLSP method combine nearest neighbor and regression to estimate missing value. Imputation process RLSP methods include 3 stages: selecting the k-nearest instances, Principal Component Analysis (PCA) process and estimation process based on the median regression results.

Based on the parameter Normalized Root Mean Squared Error (NRMSE) and classification, the method is able to predict the missing value approaching the actual value. Performance of this method is influenced by the number of k-nearest instances and Principal Component (PC). The number of k-nearest instances and Principal Component (PC) optimum is achieved when the data set has a small variance and some records being selected as the estimator has a high similarity with the record which is contain missing value. PCA is applied in this method make this method suitable when used on data that has a very large dimension. In addition, although the data contain outliers up to 10%, this method is still able to predict the value of MV it well.

Keyword: missing value, Robust Least Squares Estimation with Principal Component (RLSP), outlier, Normalized

Subjek

Sistem Komputer dan Jaringan Komputer
 

Katalog

Analisis Penanganan Missing Value dengan Metode Robust Least Squares Estimation with Principal Component (RLSP)
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Prima Arti Hastuti
Perorangan
Imelda Atastina, Kemas Rahmat Saleh Wiharja
 

Penerbit

Universitas Telkom
Bandung
2011

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini