EKSTRAKSI KATA KUNCI DENGAN MENGGUNAKAN CONDITIONAL RANDOM FIELDS

MINARDI DARMAWAN

Informasi Dasar

113051084
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Berbagai informasi dalam jumlah besar dapat diperoleh dengan mudah dari Internet. Tetapi, tidak mudah untuk mencari informasi yang berguna diantara sekian banyak sumber informasi yang kita dapatkan. Beberapa search engine dapat melakukan pencarian teks lengkap, tetapi hasilnya kurang memuaskan. Efiesiensi pencarian dari jumlah dokumen yang sangat banyak sangat dipengaruhi oleh kualitas dari kata kunci yang diberikan oleh setiap dokumen. Oleh karena itu, perlu dibutuhkan kata kunci yang berkualitas yang diambil secara otomatis di-ekstrak dari dokumen-dokumen agar mendapatkan nilai efisiensi yang tinggi. Pada Tugas Akhir ini, akan membahas mengenai ”Ekstraksi Kata Kunci dengan menggunakan Conditional Random Fields”. Conditional Random Fields (CRF) adalah model probabilistik untuk segmentasi dan pelabelan data sekuens. CRF menggunakan teknik yang berbeda dalam melakukan preprocessing dimana kalimat-kalimat yang ada akan disegmentasi dan diberi label, sehingga akan memberikan pengaruh terhadap hasil dari ekstraksi kata kunci tersebut. Pengujian dilakukan dengan menghitung nilai precision, recall dan F-Measure untuk mengetahui performansi sistem yang akan dibuat. Hasil pengujian menunjukkan bahwa ekstraksi kata kunci dengan CRF memiliki akurasi yang lebih baik pada jenis dokumen yang bersifat umum (topik umum) atau dengan kata lain memiliki variasi data yang tinggi. Sedangkan dari sisi fungsi fiturnya, fitur POS (tanpa normalisasi) memberi pengaruh yang cukup signifikan terhadap performansi sistem, sedangkan fitur Len tidak memberikan pengaruh yang signifikan terhadap performansi sistem. Selain itu, berdasarkan jumlah dokumen trainingnya, ekstraksi kata kunci dengan CRF bisa diterapkan secara efektif walaupun jumlah data trainingnya sedikit.Kata Kunci : Ekstraksi kata kunci, Conditional Random Fields, preprocessing, fitur POS, fitur Len, F-Measure.ABSTRACT: A variety of large amounts of information can be obtained easily from the Internet. However, it is not easy to find useful information among the many sources of information that we get. Some search engines can perform full text search, but the results are less satisfactory. Efficiency search of the number of documents that are very much very much influenced by the quality of the keywords provided by each document. Therefore, the necessary quality required keywords are retrieved automatically extracted from documents in order to obtain high efficiency values. In this Final Project, will discuss "Keyword Extraction using Conditional Random Fields". Conditional Random Fields (CRF) are probabilistic models for segmenting and labeling sequence data. CRF using different techniques in performing preprocessing in which sentences are to be segmented and labeled, so that will give effect to the results of keyword extraction. Test results showed that the extraction of keywords with CRF have a better accuracy on the document type of a general nature (general topics), or in other words having high data variation. In terms of its functions, POS features (without normalization) gives significant effect on system performance, while Len feature does not have a significant influence on system performance. In addition, training was based on the number of documents, extraction of keywords with CRF can be applied effectively even though the amount of training was a bit of data.Keyword: Keyword extraction, Conditional Random Fields, preprocessing, POS feature, Len feature, F-Measure.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

EKSTRAKSI KATA KUNCI DENGAN MENGGUNAKAN CONDITIONAL RANDOM FIELDS
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

MINARDI DARMAWAN
Perorangan
Imelda Atastina, Yanuar Firdaus A.W.
 

Penerbit

Universitas Telkom
Bandung
2012

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini