APLIKASI HELP-DESK DENGAN CLUSTERING STUDI KASUS: DOKUMEN KESELAMATAN KERJA DI PT. PERTAMINA UP IV CILACAP

IKA RAHMAWATI

APLIKASI HELP-DESK DENGAN CLUSTERING STUDI KASUS: DOKUMEN KESELAMATAN KERJA DI PT. PERTAMINA UP IV CILACAP

IKA RAHMAWATI

Informasi Dasar

APLIKASI HELP-DESK DENGAN CLUSTERING STUDI KASUS: DOKUMEN KESELAMATAN KERJA DI PT. PERTAMINA UP IV CILACAP

Dilihat

341 kali

No. Katalog

113030128

Klasifikasi

005.1

Jenis katalog

Karya Ilmiah - Skripsi (S1) - Reference

Abstraksi

ABSTRAKSI: Data mining adalah proses eksplorasi dan analisa data yang berjumlah besar untuk mendapatkan pola yang berguna. Data mining merupakan proses gabungan antar bidang-bidang terutama machine learning, analisis statistik, dan basis data
Salah satu task yang penting dalam data mining adalah clustering. Clustering adalah proses mempartisi sekumpulan objek ke dalam cluster-cluster. Objek-objek yang mirip akan ditempatkan dalam cluster yang sama dan cluster yang berbeda akan ditempatkan dalam cluster yang berbeda.
Tugas akhir ini berusaha untuk mengelompokkan dokumen dengan menggunakan algoritma top-k scoring. Dokumen yang digunakan adalah dokumen keselamatan kerja di PT.Pertamina UP IV Cilacap, sebab dokumen di perusahaan ini tersusun atas dokumen teks yang tidak terstruktur dan kompleks, sehingga membutuhkan usaha yang besar untuk pencarian terhadap dokumendokumen untuk menghadapi suatu permasalahan. Adapun kemiripan antar dokumen diukur dengan penjumlahan sederhana dari kemunculan kata-kata pada dokumen yang dibandingkan.
Setelah dilakukan pengujian dengan beberapa threshold, hasil uji menunjukkan bahwa algoritma top-k scoring dapat digunakan untuk mengelompokkan dokumen berbahasa Indonesia dengan tingkat akurasi sampai dengan 96.67%. Tingkat akurasi ini dihitung dengan cara membandingkan hasil clustering dengan hasil pengelompokan secara manual.Kata Kunci : data mining, clustering, top-k scoring, cluster, WIDF.ABSTRACT: Data mining is an exploration process and can be applied at huge data analysis to gain useful pattern. Data mining is a combination process between several fields for example machine learning, statistical analysis, and database.
One of the important task in data mining is clustering. Clustering is a process to partition data objects into clusters. The similar objects will be placed into the same cluster and the different objects will be placed into different clusters.
The aim of this final project is grouping documents by Top-k scoring algorithm. The documents here are taken from work security documents of PT.Pertamina UP IV Cilacap, because it contents of unstructured complicated text documents which needs big effort to find out solution documents manually to face a problem. Similarity or distance is measured by simple additive count of words found in both documents that are compared.
After the testing with several threshold, the results shows that top-k scoring algorithm can be used to group Indonesian documents with accuracy up to 96.67%. The calculation of the accuracy was done by comparing the clustering result with the result of manual grouping.Keyword: data mining, clustering, top-k scoring, cluster, WIDF.