PENCARIAN ANOMALI BERDASARKAN KERAPATAN DATA MENGGUNAKAN ALGORITMA SHARED NEAREST NEIGHBORS DENSITY Anomaly Detection Based On Data Density Using Shared Nearest Neighbors Density Algorithm

Noor Cholis

Informasi Dasar

113038033
005.262
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Data anomali yang merupakan sebuah data yang mempunyai karakteristik berbeda dengan kebanyakan data merupakan suatu kejadian yang jarang muncul pada suatu kasus pada sebuah sumber data. Deteksi anomali ini sering digunakan sebagai dasar untuk beberapa aplikasi seperti fraud detection, data cleaning dan lain lain.
Pada penelitian ini dilakukan deteksi anomali menggunakan metode clustering untuk melakukan pengelompokan data berdasarkan data data sejenis. Metode clustering ini menggunakan sudut pandang kerapatan data untuk mendeteksi apakah suatu obyek merupakan sebuah anomali. Untuk mendeteksi data anomali dengan sudut pandang ini terdapat beberapa permasalahan data seperti banyaknya dimensi, ukuran data, bentuk data pada suatu cluster dan jenis kerapatan data yang berbeda beda. Algoritma yang digunakan untuk deteksi anomali ini menggunakan shared nearest neighbors density yang mempunyai karakteristik dapat digunakan untuk karakteristik data seperti diatas.
Dasar dari pendekatan clustering ini adalah mengkelompokkan data berdasarkan ketetanggaan terdekat. Dengan menggunakan konsep ketetanggaan terdekat ini dapat di gunakan untuk menghitung data baik dengan dimensi yang rendah maupun dimensi yang tinggi. Representasi ketetanggaan terdekat ini kemudian ditransformasi menjadi bentuk lain yaitu shared nearest neighbors . Sebuah link akan mempunyai link yang kuat antara dua buah obyek apabila jumlah ketetanggaan yang dibagi antara keduanya tinggi. Link representasi ini dapat digunakan untuk mengkelompokkan data dengan data yang berbeda kerapatan karena tidak lagi tergantung terhadap pengukuran jarak antara dua buah obyek. Dengan radius tertentu kemudian dapat dihasilkan nilai kerapatan pada suatu obyek. Dengan nilai kerapatan ini dapat ditentukan jenis dari obyek tersebut apakah sebagai suatu titik pusat, border pada suatu cluster maupun dikategorikan sebagai suatu data yang bersifat anomali karena mempunyai kerapatan yang rendah.
Kata Kunci : Deteksi Anomali, Algoritma Shared Nearest Neighbors DensityABSTRACT: Anomaly data is a data that have different characteristic from common of data. This data rarely happen in the dataset. Anomaly detection is approach detect this data and widely used in the real world today such as fraud detection, data cleaning and so on.
In this research, anomaly detection is used with clustering method approach which is grouping data based on the characteristic of data. This clustering based on data density to detect anomaly data. There is some problem with this approach such low and high dimension, data size in clustering, data shape and different densities in different cluster. This anomaly detection using shared nearest neighbors density algorithm as base algorithm which have a characteristic to solve problem mention above.
Basic of this clustering approach is grouping data with their nearest neighbors. With this concept, the algorithm suitable for low and high dimensional data. With this nearest neighbors then is transformed to the shared nearest neighbors. A strong link between two object is representated with number of neighbor which is shared between two of object. This link is used to group data with different densities on different cluster because this approach subtitute a distance measure between two object with this representative link. With radius then resulting density value for each object. This radius determine is an object core point, border point or anomaly point. An anomaly object is an object which have low density comparing with common object.Keyword: Anomaly Detection, Shared Nearest Neighbors Density Algorithm

Subjek

ALGORITHMS PROGRAMMING
 

Katalog

PENCARIAN ANOMALI BERDASARKAN KERAPATAN DATA MENGGUNAKAN ALGORITMA SHARED NEAREST NEIGHBORS DENSITY Anomaly Detection Based On Data Density Using Shared Nearest Neighbors Density Algorithm
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Noor Cholis
Perorangan
-
 

Penerbit

Universitas Telkom
Bandung
2006

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini