ANALISIS ALGORITMA EXPECTATION MAXIMIZATION (EM) dalam PENANGANAN MISSING VALUE

Law rencus Sirait

Informasi Dasar

113040228
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Data mining adalah teknik mengekstraksi atau penemuan pola, informasi, pengetahuan dari data yang jumlahnya besar. Didalam proses penemuannya faktor kualitas data adalah sangat penting. Jika data tidak berkualitas maka kualitas analisis data menjadi kurang akurat. Salah satu faktor penentu berkualitasnya suatu data adalah faktor missing value dari data yang digunakan. Missing value akan sangat berarti jika jumlah data yang missing tersebut cukup besar yang dapat mempengaruhi keakuratan dan kualitas kesimpulan pola yang dihasilkan.

Dalam menyelesaikan kasus missing value ini akan dipergunakan metoda imputation. Metoda imputation yang digunakan adalah algoritma Expectation Maximization. Sehingga dalam Tugas Akhir ini akan dilakukan analisis penanganan missing value dengan algoritma Expectation Maximization. Tujuan analisis ini adalah untuk melihat performansi algoritma ini dalam menangani missing value dengan menggunakan parameter Normalized Root Mean Squared Error (NRMSE). Kemudian menganalisa data hasil imputasi dengan menggunakan klasifikasi KNN yang ada pada WEKA dengan parameter yang digunakan yaitu Precision, Recall dan F-Measure. Berdasarkan hasil penelitian yang dilakukan, didapatkan bahwa algoritma ini mampu menangani missing value dengan baik dan data imputasi yang dihasilkan memiliki kualitas yang hampir berdekatan dengan dataset lengkap yang digunakan.Kata Kunci : Data minining, missing value, Imputation, Algoritma EM, NRMSE,ABSTRACT: Data mining is the extraction technique or the discovery of patterns, information, knowledge from large amounts of data. In the process of discovery data quality factor is very important. If the data is not quality then the quality of the data analysis becomes less accurate. One of the determinants of its quality factor is missing value of the data used. Missing values will be significant if the amount of missing values is large enough that could affect the accuracy and quality of the conclusions resulting pattern.

In resolving the case of missing value imputation method will be used. Imputation method used is the Expectation maximization algorithm. So in the Final Project will be conducted the analysis with the handling of missing values Expectation maximization algorithm. The purpose of this analysis is to see the performance of these algorithms in dealing with missing values using the parameters Normalized Root Mean Squared Error (NRMSE). Then analyze the data imputation using the classification of KNN in Weka with the parameters used are Precision, Recall and F-Measure. Based on the results of research has conducted, it was found that the algorithm is able to handle missing values properly and data imputation produced has a quality that is almost adjacent to the complete dataset used.Keyword: Data minining, missing values, Imputation, EM algorithm, NRMSE,

Subjek

Rekayasa Perangkat Lunak
 

Katalog

ANALISIS ALGORITMA EXPECTATION MAXIMIZATION (EM) dalam PENANGANAN MISSING VALUE
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Law rencus Sirait
Perorangan
Shaufiah, Angelina Prima Kurniati
 

Penerbit

Universitas Telkom
Bandung
2013

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini