1 / 22

PENGEMBANGAN SISTEM PENGENALAN HURUF ARAB DENGAN EKSTRAKSI FITUR MORFOLOGI

PENGEMBANGAN SISTEM PENGENALAN HURUF ARAB DENGAN EKSTRAKSI FITUR MORFOLOGI. M. ALBADR LUTAN NASUTION 13508011. Pendahuluan. Latar Belakang. Aplikasi pengenalan huruf sangat praktikal Bahasa arab dipakai oleh 50 negara

tanaya
Download Presentation

PENGEMBANGAN SISTEM PENGENALAN HURUF ARAB DENGAN EKSTRAKSI FITUR MORFOLOGI

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. PENGEMBANGAN SISTEM PENGENALAN HURUF ARABDENGAN EKSTRAKSI FITUR MORFOLOGI M. ALBADR LUTAN NASUTION 13508011

  2. Pendahuluan

  3. Latar Belakang • Aplikasi pengenalan huruf sangat praktikal • Bahasa arab dipakai oleh 50 negara • Riset untuk huruf Arab cenderung masih sedikit dibanding huruf latin dan Asia lain • Pembahasan fitur morfologis dan segmentasi huruf Arab masih sedikit

  4. Rumusan Masalah • Proses segmentasi yang mendukung • Fitur-fitur yang menjadi karakteristik huruf • Kepentingan tiap fitur • Kombinasi fitur dengan akurasi terbaik

  5. Tujuan Berhasil dibangunnya perangkat lunak yang dapat mengenali huruf Arab.

  6. Batasan Masalah • Bentuk citra : pindaian dokumen • Hanya huruf dan angka arab saja • Tidak mengenali angka arab internasional • Ligatur, harakat, dan tanda baca tajwid tidak ditangani pada tugas akhir

  7. Studi Literatur

  8. Sistem Tulisan Arab • Terdapat 28 huruf dan hamzah • Tulisan selalu kursif • Terdapat komponen sekunder • Bentuk huruf berubah sesuai posisi • Kata terpisah oleh upakata • Sering terdapat ligatur • Terkadang terdapat diakritik (harakat - tanda baca vokal)

  9. Contoh Tulisan Arab 1 upakata baseline 1 kata 1 kata ligatur Al-Mamlakah al-'Arabiyah as-Sa'udiyah – Kerajaan Arab Saudi

  10. Pengenalan Huruf

  11. Praproses Citra bertujuan untuk mengolah data citra mentah menjadi data yang lebih berguna. • Normalisasi histogram • Reduksi noise • Deteksi tepi • Penulangan/ penipisan • Skala dan rotasi • Deteksi garis dasar (baseline)

  12. Segmentasi bertujuan untuk memisahkan antar huruf dalam kata atau memisahkan citra per baris atau per kata

  13. Ekstraksi Fitur • Fitur level rendah • Diperoleh tanpa ada informasi tentang bentuk • Misalnya batas tepi, dan rasio piksel • Fitur level tinggi • Fitur terkait dengan bentuk pada citra • Misalnya bentuk persegi, elips, dan mata

  14. Penelitian Terkait (1/4) • Pengenalan pelat nomor kendaraan oleh Sarfraz dkk. (2003) • Fitur perbandingan piksel dengan templat • Akurasi hingga 95% dengan font tunggal • Pengenalan huruf arab secara online oleh Al-Taani & Al-Haj (2010) • Fitur rasio persebaran densitas huruf • Akurasi hingga 90%

  15. Penelitian Terkait (2/4) • Pengenalan huruf arab multifont oleh Izakian dkk. (2008) • Fitur kode rantai • Fitur kode posisi komponen sekunder • Pengujian dengan 3 font • Akurasi hingga 97%

  16. Penelitian Terkait (3/4) • Pengenalan huruf arab multifont oleh Zidouri (2010) • Dua level pengenalan bentuk upakata lalu huruf • Fitur perbandingan piksel • Jaringan saraf tiruan • Usulan teknik segmentasi baru

  17. Penelitian Terkait (4/4) • Pengujian berbagai fitur huruf arab oleh Abandah dkk. (2005, 2008, 2009) • Empat fitur utama: • Komponen sekunder • Fitur badan utama • Fitur tulang • Fitur perbatasan • Implementasi 95 fitur huruf arab • Perbandingan akurasi antar fitur

  18. Deskripsi Solusi

  19. Implementasi Tahapan Pengenalan Huruf

  20. Fitur Huruf • Fitur badan utama huruf Rasio pesebaran, bentuk lengkung, aspek rasio, arah lengkung, jumlah lubang, dll • Fitur komponen sekunder huruf Jumlah, posisi, dan bentuk komponen, dll • Fitur tulang Titik minat, kode rantai, dll

  21. Pelatihan dan Pengujian Data latih dan uji : • Dokumen cetak dengan ragam font • Basis data IFN/ENIT Persentase data latih dan uji : 50% - 50%

  22. Terima Kasih

More Related