Implementasi Ekstraksi Frasa Kunci untuk Dokumen Teks Berbahasa Indonesia Menggunakan Metode CorePhrase

Fenny Yohana Anggraeni

Informasi Dasar

113051020
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Saat ini sudah banyak digunakan berbagai jenis metode untuk ekstraksi frasa kunci. Terdapat dua kategori untuk algoritma frasa kunci diantaranya ekstraksi frasa kunci untuk dokumen tunggal dan ekstraksi frasa kunci untuk sekelompok dokumen.

Kategori ekstraksi frasa kunci yang dibahas pada tugas akhir ini adalah ekstraksi frasa kunci untuk sekelompok dokumen. Metode yang digunakan adalah metode CorePhrase. Diharapkan dengan menggunakan metode CorePhrase ini didapat frasa kunci yang sesuai dengan topik dan memiliki performansi yang baik.

Metode CorePhrase bekerja dengan mengiriskan dokumen menggunakan graph-based model kemudian feature dari tiap kandidat keyphrase yang diekstraksi dihitung lalu dilakukan perhitungan rangking terhadap phrase feature yang didapat untuk kemudian diperoleh nilai top rank nya.

Pada tugas akhir ini performansi dari tiap frasa kunci dapat diukur dengan berdasarkan overlap dan precision-nya. Berdasarkan percobaan yang dilakukan didapat nilai performansi overlap yang paling tinggi adalah sebesar 1 dan nilai performansi precision yang paling tinggi adalah sebesar 1. Dapat dikatakan bahwa performansinya sangat baik. Keyphrase yang dihasilkan sesuai dengan topik dokumen.Kata Kunci : CorePhrase , ekstraksi, phrase feature, overlap, precissionABSTRACT: Currently, there are many different types of methods used for keyphrase extraction. There are two categories for keyphrase extraction; keyphrase extraction for single document and keyphrase extraction from a set of document.

Keyphrase extraction categories discussed in this final project is keyphrase extraction from a set of document. The method is CorePhrase. It is expected that by using this CorePhrase can get keyphrase which accordance with the topic and has a good performance.

Corephrase works by intersecting document using graph-based model then Features of the extracted candidate keyphrases are calculated and phrases are ranked based on their feature and then will get the top rank.

In this final project the performance of each keyphrase can be measured based on the overlap and precission. Based on the experiments conducted, the performance of the highest overlap is 1 and the performance of the highest precission is 1. It could be argued that the performance is good. The resulting keyphrase is in accordance with the topic of the document.Keyword: CorePhrase , ekstraksi, phrase feature, overlap, precission

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Implementasi Ekstraksi Frasa Kunci untuk Dokumen Teks Berbahasa Indonesia Menggunakan Metode CorePhrase
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Fenny Yohana Anggraeni
Perorangan
Angelina Prima Kurniati, Kemas Rahmat Saleh Wiharja
 

Penerbit

Universitas Telkom
Bandung
2012

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini