ABSTRAKSI: Data mining adalah proses menemukan informasi yang berguna secara otomatis dari kumpulan data yang besar. Outlier adalah suatu pola yang jarang muncul pada suatu dataset. kebanyakan fungsionalitas data mining menitikberatkan kepada pencarian pola yang sering muncul dan mengesampingkan outlier. Dibalik keabnormalannya, terkadang outlier mempunyai informasi yang sangat berguna. Outlier memegang peranan penting untuk aplikasi deteksi kecurangan,pemantauan jaringan dan deteksi intrusi.
Pada Tugas akhir ini telah diimplementasikan salah satu metode pendeteksian outlier yaitu Local Sparsity Coefficient (LSC). Metode ini merupakan pengembangan dari metode Local Outlier Factor (LOF). LSC merupakan metode yang menggunakan tingkat kepadatan daerah sebagai kerangka kerjanya.
LSC diuji dengan menggunakan dataset yang memiliki distribusi,dimensi dan jumlah record yang berbeda-beda. Dari tahap pengujian dan analisa memberikan hasil bahwa metode LSC memberikan akurasi yang tinggi dalam mendeteksi outlier dengan waktu eksekusi yang cepat.
Kata Kunci : Outlier,LSC,kepadatan, akurasi,waktu eksekusiABSTRACT: Data mining is automatic process to find useful information from large data collection. Outlier is a pattern which is rarely appear in a dataset. mostly, data mining tasks emphasize on searching frequent patterns and override outlier. Behind of it abnormality, sometime outliers have very useful information. Outliers Play an important role in fraud detection, network monitoring and intrusion detection applications.
This Final Project had implemented one of outlier detection method called local sparsity coefficient (LSC). This method is developed from Local Sparsity Coefficient (LOF) . LSC is a method that uses high density regions as the framework.
LSC tested by datasets that have various distribution, dimension, and number of records. Testing and analysis result indicate that LSC provide high accuracy in detecting outlier with fast processing time.
Keyword: outlier, LSC, density, accuracy , process time