ABSTRAKSI: Optical Character Recognition (OCR) adalah sistem komputer yang mampu membaca suatu karakter, baik yang berasal dari sebuah mesin pencetak (scanner atau komputer) dan juga yang berasal dari tulisan tangan. OCR membantu meringankan pekerjaan manusia karena proses pengetikan ulang data yang telah ditulis pada selembar kertas menjadi lebih efektif dilihat dari segi waktu dan tenaga.
Terdapat beberapa tahapan dalam OCR yaitu prepocessing didalamnya terdapat proses segmentasi dan normalisasi, ekstraksi ciri, dan klasifikasi atau pengenalan karakter. Segmentasi yaitu membagi citra kedalam segmen-segmen, proses ini akan mempengaruhi akurasi pada saat pengenalan karakter, sedangkan pada tahap normalisasi terdapat teknik dilasi/penebalan dan centering pada tiap karakter tunggal. Ekstraksi ciri yaitu proses mengekstrak karakter serta mengambil ciri khusus dari karakter tunggal yang akan dikenali, metode yang digunakan pada tahap ini adalah zoning. Zoning merupakan metode ekstraksi ciri dengan membagi karakter kedalam NxM wilayah. Tahap pengenalan karakter adalah tahap pengklasifikasikan karakter. Metode yang digunakan adalah KNN(K-Nearest Neighbour). Metode ini mencocokkan karakter yang akan dikenali dengan karakter yang sudah tersimpan didalam database.
Berdasarkan implementasi yang telah dilakukan, dengan menerapkan metode zoning dan klasifikasi KNN pada penginputan nilai matakuliah mahasiswa di dalam OCR, hasil pengujian dapat dilihat dari tingkat akurasi perangka dan akurasi per-nilai. Dari pengujian yang telah dilakukan, ukuran dan bentuk karakter menjadi faktor yang mempengaruhi tingkat akurasi pada saat pengenalan karakter.Kata Kunci : OCR , preprocessing, segmentasi, normalisasi, zoning, KNN.ABSTRACT: Optical Character Recognition (OCR) is a computer system which is able to recognize a character, either from a printer, a scanner, a computer, or from human handwriting. OCR helps human jobs because inputting data from a paper will be more effective in time and energy.
There several steps in OCR. They are; preprocessing where segmentation and normalization are processed, extraction features, and character recognition, or classification. The segmentation divides an image into segments. This process affects the accuracy of the system built. Normalization is done by using dilatation/bolding process and centering in every single character. Feature extraction is extracting process of a character will be recognized. Zoning Method is used in this step. Zoning is a features extraction method dividing character into N×M zones. Character recognition is done by classifying character. The method used is K-Nearest Neighbour (KNN). It is done by matching characters will be recognized with characters stored in a database.
Based on the implementation have already been done, by implementing Zoning Method and KNN Classification on Students Subject Score Input in OCR, testing result can be looked at in the accuracy for each numbers, marks. From the testing result, shape and size of character is one of factors affecting accuracy in this character recognition system.Keyword: OCR , preprocessing, segmentation, normalization, zoning, KNN.