Dalam penelitian ini dilakukan identifikasi parafrase pada dua buah kalimat (tweet). Metode yang digunakan untuk mengidentifikasi dua buah kalimat ini yaitu algoritma Smith Waterman Distance. Dalam mengidentifikasi kalimat parafrase dua buah kalimat Smith Waterman Distance akan mengidentifikasi kemiripan kedua buah kalimat tersebut dengan mencari nilai terbesar dari local similaritiesnya.
Confusion matrix merupakan salah satu metode untuk mengukur kinerja suatu metode klasifikasi, dan pada penelitian kali ini metode klasifikasi yang akan digunakan adalah algoritma Smith Waterman Distance yang dimana berguna untuk menentukan kesamaan atau pengukuran tingkat kemiripan sebuah kalimat dengan kalimat lain dengan cara melihat kesamaan isi (local similarities) dari kedua kalimat tersebut. Dari hasil penelitian ini, diperoleh akurasi sebesar 0.609; F1 sebesar 0.480; recall sebesar 0.405 dan precision sebesar 0.590.
Kata kunci : Paraphrase, Smith Waterman Distance, Tweet, Confusion Matrix.