ABSTRAKSI: Salah satu permasalahan yang sering dimiliki oleh data mentah adalah adanya missing value. Hal ini tentunya akan mempengaruhi hasil analisis statistik pada data sehingga dapat mengurangi tingkat keakuratan data. Oleh karena itu dibutuhkan tahap prepocessing data untuk dapat menangani masalah missing value ini. Salah satu cara penanganannya adalah dengan mengisikan nilai prediksi yang diperoleh dengan menerapkan suatu algoritma tertentu, yang disebut dengan metode imputasi. Metode imputasi missing value yang digunakan dalam Tugas Akhir ini adalah metode Predictive Mean Matching (PMM).
PMM merupakan metode imputasi yang menerapkan algoritma yang berbasis model, dimana missing value diisi oleh nilai estimasi yang diperoleh dari model menggunakan Least Square Regression yang terbentuk dari baris yang tidak memiliki missing value pada data kemudian mengimputasi missing value dari nilai observasi yang terdekat dari model. Pengujian performansi hasil imputasi pada sistem dievaluasi melalui parameter Mean Squared Error (MSE). Pada Tugas Akhir ini juga dilakukan analisis pengaruh imputasi data terhadap proses klasifikasi dengan parameter pengujian Precision, Recall, dan F-Measure. Berdasarkan hasil pengujian yang dilakukan, terbukti bahwa PMM merupakan algoritma imputasi yang dapat mengestimasi nilai missing value yang mendekati nilai sebenarnya.Kata Kunci : imputasi, missing value, Predictive Mean Matching (PMM)ABSTRACT: One of the common problem that are mostly held in raw data is missing values. This will certainly affect the results of statistical analysis on data and reduce the level of data accuracy. Therefore data preprocessing stage needed for handling missing value. One way is to fill in the handling of the predicted value obtained by applying certain algorithm, which is called imputation method. Missing value imputation method used in this Final Project is Predictive Mean Matching (PMM).
PMM is a method of imputation which apply algorithm-based model, where the missing values were filled by the estimated value obtained from using the Least Square Regression models are formed from the rows that have no missing value in the data, then the imputed missing values from the closest observation of the model. Imputation test results on the system performance is evaluated through the parameter Mean Squared Error (MSE). At this final project is also carried out analysis of the influence of imputation of data for the classification process with parameter testing Precision, Recall, and F-Measure. Based on the results of tests performed, it is evident that the PMM is an imputation algorithm to estimate the missing values are close to the actual value.Keyword: imputation, missing value, Predictive Mean Matching (PMM)