Implementasi dan Analisis Keterkaitan Semantik Antar Kata Menggunakan Pointwise Mutual Informationmax dengan Estimasi dari Kata Polisemi

I MADE DARMA YOGA

Informasi Dasar

16.04.1138
006.312
Karya Ilmiah - Skripsi (S1) - Reference

Natural Language Processing atau premrosesan bahasa alami merupakan sebuah disiplin ilmu yang khusus mengolah teks yang ditulis langsung oleh manusia yang bersifat tidak terstruktur. Pengukuran semantic similarity antar kata merupakan salah satu tugas penerapan dari Natural Language Proccessing yang intinya adalah mencari skor semantic similarity antar kata. Skor tersebut menunjukkan seberapa erat tingkat kesamaan antar dua kata. Salah satu metode untuk menghitung semantic similarity adalah PMImax (Pointwise Mutual Informationmax). PMImax mengestimasi korelasi maksimum antara dua kata dan korelasi antara makna terdekat kedua kata tersebut karena sebuah kata seringkali memiliki banyak makna atau bisa disebut dengan kata Polisemi. Pada tugas akhir ini, diimplementasikan penghitungan semantic similarity antar kata menggunakan PMImax dengan menggunakan estimasi dari kata polisemi. konteks kata bersumber dari dataset Brown Corpus dan dataset Gutenberg. Hasil dari keterkaitannya dibandingkan dengan dataset Gold Standard WordSim-353 semantic relatedness, semantic similarity, Miller Charles dan Simlex-999. Hasil penelitian yang didapat terlihat bahwa dengan menggunakan PMImax didapatkan korelasi terbaik yaitu 66,5% dengan dataset gold standard WordSim-353 semantic similarity menggunakan korelasi Pearson dan dengan menggunakan nilai sense hasil analisis variabel p dan q. Nilai semantic similarity setiap pasang kata sangat dipengaruhi oleh nilai Co-Occurence sepasang kata teresebut, semakin tinggi nilai Co-Occurence suatu pasangan maka akan menghasilkan skor semantic similarity yang tinggi.

Kata Kunci: Kesamaan semantik, Pointwise Mutual Information, kata polisemi.

Subjek

Text mining
 

Katalog

Implementasi dan Analisis Keterkaitan Semantik Antar Kata Menggunakan Pointwise Mutual Informationmax dengan Estimasi dari Kata Polisemi
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

I MADE DARMA YOGA
Perorangan
M. Arif Bijaksana, Mohamad Syahrul Mubarok
 

Penerbit

Universitas Telkom
Bandung
2016

Koleksi

Kompetensi

  • IFG444 - TUGAS AKHIR II
  • CCH4A3 - PENULISAN PROPOSAL
  • CCH4D4 - TUGAS AKHIR
  • CSH4H3 - PENAMBANGAN TEKS
  • CSH4O3 - PEMROSESAN BAHASA ALAMI
  • CII4A2 - PENULISAN PROPOSAL
  • CII4G3 - PEMROSESAN BAHASA ALAMI
  • CII4E4 - TUGAS AKHIR
  • CPI4A2 - PENULISAN PROPOSAL
  • III4A4 - TUGAS AKHIR
  • CII9G6 - PROPOSAL PENELITIAN

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini