Identifikasi Parafrasa merupakan sebuah percabangan dari studi NLP yang menganalisa kemungkinan parafrasa pada dua data lingual atau lebih yang berbeda. Situs microblogging Twitter merupakan contoh nyata, sebuah berita yang memiliki informasi dapat ditulis ulang dengan informasi yang sama dan konsep berbeda, walaupun kedua berita tersebut memiliki elemen leksikal yang berbeda atau mungkin memiliki struktur sintaksis yang berbeda namun memiliki makna yang sama dapat disebut sebagai parafrasa. Dalam mengenali suatu bentuk parafrasa dapat dilakukan oleh evaluasi manusia, namun evaluasi parafrasa oleh manusia membutuhkan biaya yang besar dan waktu yang lebih lama, hal ini bisa menjadi masalah besar untuk developer.
Automatic metric adalah sebuah mesin evaluasi otomatis yang menggunakan fitur-fitur yang dapat digunakan sebagai ekstraksi lingual sehingga menghasilkan nilai (score) yang dapat digunakan sebagai ukuran parafrasa dua buah kalimat yang dibandingkan. Pada penelitian ini digunakan tiga algoritma automatic metric yaitu BLEU, METEOR, Damerau-Levensthein Edit Distance yang menguji nilai parafrasa dari data Twitter yang sama. Selain itu dilakukan analisis terhadap performa algoritma dengan membandingkan nilai korelasi human judgement antara BLEU, METEOR, Damerau-Levensthein Edit Distance.
Dari hasil simulasi yang dilakukan pada penelitian ini, diperoleh akurasi tertinggi dengan menggunakan metric METEOR dengan nilai akurasi 0,55 dan F1 sebesar 0,76. nilai tertinggi kedua didapatkan dengan metric BLEU dengan nilai akurasi 0,05 dan nilai F1 sebesar 0,70. Nilai akurasi terendah ditemukan pada metric Edit Distance dengan perolehan nilai akurasi 0,44 dan F1 sebesar 0,30.