Ekstraksi Kata Kunci Pada Jurnal Ilmiah Berbahasa Indonesia Menggunakan Conditional Random Field (CRF) Model

Riki Akbar

Informasi Dasar

113070146
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Pesatnya perkembangan internet menyebabkan peningkatan jumlah dokumen ilmiah seperti jurnal-jurnal ilmiah. Besarnya jumlah dokumen menyebabkan pemrosesan informasi membutuhkan waktu yang lama. Dengan mengkestrak kata kunci yang merepresentasikan isi dokumen, pemrosesan keseluruhan informasi pada dokumen tidak lagi diperlukan. Namun, ekstraksi kata kunci secara manual tidak efektif dan efisien dari segi waktu maupun sumber daya. Otomasi ekstraksi kata kunci diperlukan untuk mengatasi keterbatasan tersebut.

Pada Tugas Akhir ini akan diimplementasikan Conditional Random Field (CRF) model dengan menganalogikan proses ekstraksi kata kunci sebagai proses pelabelan term pada dokumen. Pemodelan ini membutuhkan proses pelatihan untuk menghasilkan parameter pendukung fitur yang optimal. Pengujian dilakukan untuk mengetahui pengaruh jumlah fitur, pendekatan ekstraksi fitur, jumlah data latih, serta keterlibatan eliminasi stopwords terhadap performansi proses ekstraksi kata kunci. Pengujian dilakukan terhadap dua kelompok dokumen dengan tingkat homogenitas berbeda (dokumen kedokteran dan kesehatan masyarakat) untuk mengetahui performansi ekstraksi kata kunci pada kedua kelompok dokumen tersebut.

Hasil pengujian menunjukkan bahwa performansi ekstraksi kata kunci terbaik pada dokumen kedokteran memberikan nilai precision 0.3892, recall 0.714, dan f-measure 0.4648 sementara performansi ekstraksi kata kunci terbaik pada dokumen kesehatan masyarakat memberikan nilai precision 0.2833, recall 0.692, dan f-measure 0.3901. Penambahan jumlah fitur dan keterlibatan eliminasi stopwords menyebabkan penurunan performansi ekstraksi kata kunci.Kata Kunci : Ekstraksi kata kunci, kata kunci, Conditional Random Field (CRF) ModelABSTRACT: The development of internet technology increases the number of scientific documents including scientific journals. The large quantity of these documents affects the time required to process information. By extracting keyword which represents the content of document observed, information processing on the entire document is no longer required. However, extracting keyword manually is both ineffective and inefficient as it is time and resource consuming. Therefore, automation of keyword extraction is applied to handle the drawbacks caused by manual keyword extraction.

In this final project, Conditional Random Field (CRF) model will be implemented to extract keywords from document by viewing the keyword extraction process as a sequence labelling process. This model requires training process to produce optimum feature supporting parameters. Testing process will be conducted to figure out the influences of factors such as number of features used, feature extraction approach used, the number of training documents, and the involvement of stopwords elimination on keyword extraction performance achieved by the system. The testing process will be conducted on two groups of document (medicine and public health documents) that have different rate of content homogeinity in order to figure out performance achieved on each document group.

The result shows that best performance of keyword extraction on medicine documents produces precision of 0.3892, recall of 0.714, and f-measure of 0.4648 while the best performance of keyword extraction on public health documents produces precision of 0.2833, recall of 0.692, and f-measure of 0.3901. The increase of the number of feature used and involvement of stopwords elimination produce lower performance of keyword extraction.Keyword: Keyword Extraction, Keyword, Conditional Random Field (CRF) Model

Subjek

Informatika Teori dan Pemrograman
 

Katalog

Ekstraksi Kata Kunci Pada Jurnal Ilmiah Berbahasa Indonesia Menggunakan Conditional Random Field (CRF) Model
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Riki Akbar
Perorangan
Ade Romadhony, Bedy Purnama
 

Penerbit

Universitas Telkom
Bandung
2012

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini