ABSTRAKSI: Makin berkembangnya teknologi informasi di instansi pemerintah, memunculkan wacana baru untuk membuat data warehouse dari beberapa sistem departemen tertentu, dalam hal ini, yaitu BKKBN, DEPTAN, dan BPS, untuk membantu pengambilan keputusan, yaitu dengan membangun Intra-Govermental Access To Shared Information System (IGASIS).
Data-data yang dikumpulkan dari bermacam sumber tersebut masih terdapat kesalahan, tidak konsisten dan terdapat duplikasi. Untuk memperbaikinya, dibutuhkan proses data cleansing atau data cleaning yaitu kegiatan untuk mengisi missing values, menghilangkan noise dan memperbaiki inconsistency pada data.
Proses data cleaning ini merupakan proses awal yang memakan waktu lama dan sulit yang membutuhkan analisa lebih lanjut. Untuk lebih memudahkan proses ini, dalam Tugas Akhir ini akan mengotomatisasi proses tersebut dengan membangun aplikasi sebagai alat bantu dengan pendekatan hybrid matcher dan algoitma n-gram.Kata Kunci : data cleaning, data pemerintahan, hybrid matcher, n-gram.ABSTRACT: More and more expanding in information technology of governmental institution, peeping out new discourse to make data warehouse from some certain departmental system, in this case, that is BKKBN, DEPTAN, and BPS, to assist decision making, that is by developing Intra-Govermental Access To Shared Information System IGASIS).
Collected data from kinds of the source still there are mistake, is not consistent and there are duplication. To improve it, required data cleansing process or data cleaning that is activity to fill missing values, noise elimination and improve data inconsistencies.
This data cleaning process represent early process that time-consuming and difficult which require furthermore analysis. To be more facilitate this process, in this Final Project will develope an application as tool for process automatization with hybrid matcher approach and n-gram algorithm.Keyword: data cleaning, governance data, hybrid matcher, n-gram.