ABSTRAKSI: Optical Character Recognation merupakan suatu teknik untuk merubah data tulisan tangan, mesin ketik maupun mesin cetak (tulisan dalam bentuk non-digital) menjadi bentuk tulisan digital yang dapat dirubah menggunakan komputer. Pada OCR terdapat beberapa tahap yang yang harus dilakukan antara lain Image Acquisition, Image Preprocessing, Feature Extraction dan Classification
Dalam tugas akhir ini akan dikembangkan suatu sistem yang dapat membaca tulisan tangan huruf Jepang (KANA) dengan menerapkan metode Independent Component Analysis (ICA) sebagai image transformator pengganti tahap feature extraction dan Learning Vector Quantization (LVQ) sebagai classifier. Hasil akurasi terbaik yang dihasilkan oleh sistem ini ialah 69.5652% untuk data latih hiragana, 61.087% untuk data latih katakana, 43.913% untuk data uji hiragana dan 33.4783% untuk data uji katakana. Hasil akurasi ini didapatkan dengan menggunakan 5 IC (independent component) dari 8 IC yang dibangkitkan untuk hiragana dan 2 IC dari 5 IC yang dibangkitkan untuk katakana. Kemudian pada tahap pelatihan besar learning rate terbaik yang digunakan ialah 0.0015 baik pada hiragana maupun katakana dan jumlah hidden neuron yang terbaik untuk hiragana ialah 184 hidden neuron sedangkan untuk katakana ialah 230 hidden neuron. Hasil akurasi yang kurang baik ini disebabkan tingkat kemiripan yang cukup tinggi antar huruf sehingga sangat sulit bagi classifier untuk mengenali huruf-huruf Jepang tersebut.Kata Kunci : Optical Character Recognation, hiragana, katakana, independent component analysis, learning vector quantization.ABSTRACT: Optical Character Recognation is a technique to alter the handwriting, typewriters and printing machines (written in the form of non-digital) into digital form of writing that can be changed using a computer. In the OCR, there are several steps that must be done, among others, Image Acquisition, Image Preprocessing, Feature Extraction and Classification.
In this final project will be developed a system that can read handwritten Japanese characters (KANA) by applying the method of Independent Component Analysis (ICA) as a image transformator changing the feature extraction step and Learning Vector Quantization (LVQ) as a classifier. The best accuracy of results generated by this system is 69.5652% for practicing hiragana data, 61 087% for training data katakana, 43 913% for test data 33.4783% hiragana and katakana for test data. The results of this accuracy is obtained by using 5 IC (independent component) of 8 IC is raised to hiragana and 2 of IC 5 IC is raised to say. Later in the training stage of the learning rate of 0.0015 is best used either in hiragana or katakana, and the number of hidden neurons that are best for hiragana to 184 hidden neurons while katakana is 230 hidden neurons. The results are less good accuracy is due to a high enough level of similarity between the letters so it is very difficult for the classifier to recognize the Japanese characters.Keyword: Optical Character Recognation, hiragana, katakana, independent component analysis, learning vector quantization.