Kategorisasi Dokumen Otomatis Menggunakan Basisdata Berorientasi Dokumen

YOSSAN SEPTRIO ATMA

Informasi Dasar

16.04.668
C
Karya Ilmiah - Skripsi (S1) - Reference

Text categorization bertujuan untuk mendefiniskan kategori dari dokumen yang belum diketahui kategorinya. Salah satu algoritma dalam text categorization adalah algoritma multinomial naïve bayes yang diketahui memiliki cara kerja yang sangat sederhana, efektif dan mempunyai performansi yang bagus. Pada penelitian-penelitian sebelumnya, text categorization hanya sampai pada tahap kategorisasi saja. Pada penelitian ini, file biner dokumen hasil kategorisasi akan disimpan ke dalam basisdata agar pengolahan data dapat dilakukan dengan mudah. Salah satu basisdata jenis NoSQL adalah document oriented dan salah satu DBMS dari document oriented adalah MongoDB. MongoDB mempunyai fitur GridFS dan sharding yang dapat menyimpan file biner secara distribusi ke dalam beberapa mesin. Dengan menempatkan data pada beberapa mesin memungkinkan untuk menyimpan lebih banyak data dan menangani beban lebih besar tanpa diperlukan adanya mesin dengan performansi tinggi. Dari hasil pengujian yang dilakukan, performansi kategorisasi teks berada diatas nilai 88% pada pemakaian 756 data latih dan 84 data uji. Untuk basisdata dokumen, hasil terbaik yang didapatkan dengan nilai response time 1,713 detik dan throughput 130,869 transaksi per detik. Kata kunci : Text categorization, NoSQL, document oriented database, GridFS, sharding

Subjek

Text mining
 

Katalog

Kategorisasi Dokumen Otomatis Menggunakan Basisdata Berorientasi Dokumen
 
 
Bahasa Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

YOSSAN SEPTRIO ATMA
Perorangan
Kemas Rahmat Saleh
 

Penerbit

Universitas Telkom
Bandung
2016

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini