Implementasi dan Analisis Keterkaitan Semantik Berbahasa Indonesia dengan Pendekatan Pointwise Mutual Information

PUTU GEDE BIMANTARA SEWANA PARTA

Implementasi dan Analisis Keterkaitan Semantik Berbahasa Indonesia dengan Pendekatan Pointwise Mutual Information

PUTU GEDE BIMANTARA SEWANA PARTA

Informasi Dasar

Implementasi dan Analisis Keterkaitan Semantik Berbahasa Indonesia dengan Pendekatan Pointwise Mutual Information

Dilihat

353 kali

No. Katalog

17.04.1116

Klasifikasi

620.007

Jenis katalog

Karya Ilmiah - Skripsi (S1) - Reference

Abstraksi

Natural Language Processing (NLP) atau premrosesan bahasa alami merupakan sebuah disiplin ilmu yang khusus mengolah teks yang ditulis langsung oleh manusia dan mempunyai sifat tidak terstruktur. Pengukuran semantic similarity antar kata merupakan salah satu tugas penerapan dari Natural Language Proccessing yang intinya adalah mencari skor semantic similarity antar kata. Skor tersebut menunjukkan seberapa erat tingkat kesamaan antar dua kata. Salah satu metode untuk menghitung semantic similarity adalah PMI (Pointwise Mutual Information). Keterkaitan semantik merupakan salah satu jenis pengukuran yang ada pada text mining untuk menggambarkan bagaimana hubungan antara kata. Tujuan dari pengukuran keterkaitan semantik ini adalah untuk memperoleh nilai atau skor yang merepresentasikan seberapa besar keterkaitan antar dua kata tersebut. Pointwise Mutual Information (PMI) adalah salah satu pengukuran secara statistik untuk keterkaitan semantik yang telah banyak digunakan. Pointwise Mutual Information (PMI) merupakan varian yang digunakan dalam tugas akhir ini untuk menghitung keterkaitan semantik. Perhitungan nilai PMI dilakukan pada dataset yang didapat dari wikipedia Bahasa Indonesia. Nilai PMI yang didapatkan oleh aplikasi dihitung korelasinya. Hasil dari penelitian pada tugas akhir ini merupakan nilai korelasi antara skor yang dihasilkan sistem dengan gold standard SimLex-999, WordSim-353 dan Miller and Charles yang menghasilkan nilai kolerasi yang akan menunjukan seberapa baik metode pengukuran PMI. Nilai korelasi tertinggi yaitu 0,256 dengan menggunakan window size = 25.

Kata Kunci: Semantik, Text Mining, Pointwise Mutual Information.