Bahasa Arab memilki tingkat kesulitan yang cukup tinggi dibandingkan dengan Bahasa Latin dalam hal Optical Character Recognition (OCR). Hal ini disebabkan oleh beberapa hal:
- Huruf Arab terdiri dari 28 huruf yang terbentuk dari garis dan titik.
- Terdapat 10 huruf yang memiliki 1 titik, 3 huruf memiliki 2 titik, dan 2 huruf yang memiliki 3 titik.
- Setiap huruf memiliki 4 pola yang berbeda, yaitu: terpisah (isolated), di awal kalimat (beginning), di tengah kalimat (middle), dan di akhir kalimat (end).
- Sebagian besar huruf bias terhubung dari 2 sisi, kiri dan kanan (middle).
- Terdapat 6 huruf yang hanya bisa terhubung dari 1 sisi saja, yaitu sebelah kanan.
Hal ini merupakan tantangan tersendiri bagi para penggiat di dunia OCR khususnya arabic letters.
0 komentar:
Posting Komentar