Graphical Concept-Based Mining Model pada Kategorisasi dan Klasterisasi Dokumen Berbahasa Indonesia

Widyanto Adi Saputro

Informasi Dasar

113040184
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Text mining merupakan bagian dari data mining yang memfokuskan bidangnya pada pengambilan informasi berharga dari database yang berupa teks. Sebagian besar proses data mining menggunakan dua metode yaitu kategorisasi yang dikenal juga dengan klasifikasi, dan klasterisasi. Kategorisasi adalah teknik yang bertujuan untuk menentukan topik dari suatu artikel atau text document berdasarkan atribut kelas yang sudah ditentukan sebelumnya (supervised). Sedangkan klasterisasi adalah pengelompokan topik dari suatu artikel berdasarkan kemiripannya dengan artikel yang lain tanpa melihat atribut kelasnya (unsupervised).
Jika diperhatikan lebih lanjut, sebagian besar teknik pengelompokan pada text mining bekerja berdasarkan analisis statistikal dari frekuensi kemunculan term pada suatu dokumen tanpa menghiraukan semantik atau arti kata dari term tersebut. Sehingga bisa saja terjadi dua term mempunyai frekuensi yang sama pada suatu dokumen padahal salah satu term diantara kedua term tersebut memberikan kontribusi yang lebih besar dalam proses penentuan topik sebuah dokumen. Oleh karena itu perlu diterapkan pendekatan baru yang melibatkan term yang mempunyai peranan dalam semantik kalimat untuk mencapai hasil yang lebih akurat.
Graphical concept-based mining model memberikan pendekatan baru dalam pemisahan term yang berarti dan yang tidak berarti bagi penentuan topik sebuah dokumen berdasarkan peranan term dalam semantik. Hal tersebut yang menyebabkan graphical concept-based mining model memberikan hasil yang lebih akurat.Kata Kunci : TF IDF, graphical concept-based mining model, conceptual ontological graph, concept, semantik.ABSTRACT: Text mining is a part of the data mining field which is focuses its work on getting valuable information from the text database. If we pay attention, most of the data mining process using two methods, categorization and clusterization. Categorization is a technique that aims to determine the topic of an article or text document based on the class attribute (supervised). While clusterization grouping the article into topic based on the similarity with the other articles (unsupervised).
Most of the categorization techniques are based on analysis of the frequency of term occurrences in the document without considering the semantics or meaning of the word. However, two term can have the same frequency in their documents, but one term contributes more to the meaning of its sentences than the other term. Therefore, we need to apply a new approach that involves the terms that have a role in the semantics to achieve more accurate results.
Graphical concept-based mining model provides a new approach in the separation of the term which is important and not important for determinate the topic of a document based on the term in the role of semantics. This causes a graphical concept-based mining model provides more accurate results.Keyword: TF IDF, graphical concept-based mining model, conceptual ontological graph, concept, semantic.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Graphical Concept-Based Mining Model pada Kategorisasi dan Klasterisasi Dokumen Berbahasa Indonesia
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Widyanto Adi Saputro
Perorangan
Moch. Arif Bijaksanaech, ZK. Abdurahman Baizal
 

Penerbit

Universitas Telkom
Bandung
2009

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini