160 likes | 445 Views
عنوان البحث. التعرف الآلي على الكلام العربي ــــــــــــــــــــــــــــــــــــــــــــــــــــــــ تقديم: عمار سـايـر العنـزي إبراهيم حميد المالكي. أهداف البحث. ماهية التعرف الآلي على الكلام. لماذا اتجه الباحثون والعلماء إلى التعرف الآلي على الكلام؟
E N D
عنوان البحث التعرف الآلي على الكلام العربي ــــــــــــــــــــــــــــــــــــــــــــــــــــــــ تقديم: عمار سـايـر العنـزي إبراهيم حميد المالكي
أهداف البحث • ماهية التعرف الآلي على الكلام. • لماذا اتجه الباحثون والعلماء إلى التعرف الآلي على الكلام؟ • بعض استخدامات التعرف الآلي على الكلام. • فهم المبدأ الرياضي المستخدم في التعرف على الكلام. • معرفة التحديات التي تواجه التعرف على الكلام العربي. • طرح بعض المقارنات. • بعض البرامج والجهود في التعرف على الكلام العربي.
المقدمة • ماهو التعرف الآلي على الكلام؟ • ماهي الحاجة للتعرف الآلي على الكلام؟ • كيف بدأت فكرة التعرف الآلي على الكلام؟
نظرة تاريخية • التعرف على الكلام الإنجليزي: • بداية السبعينات: HMM • 1971: DARPA • 1984: SpeechWorks • 1995: Dragon & IBM(Isolated SR) • 1997: Dragon(Cont. SR)
نطرة تاريخية(يتبع) • التعرف على الكلام العربي: • 1986: أبحاثIBM • 1990: برنامج يعمل على أجهزة RISC. • 1997: طرحت IBM أول برنامج في التعرف على الكلام العربي. • 2000: طرحت صخر أول برنامج لها في التعرف على الكلام العربي.
أنواع أنظمة التعرف على الكلام • الكلمات المقسمة أو الحديث المقسم. • الكلمات المتصلة أو الجملة المتقطعة. • الحديث المتصل.
تطبيقات التعرف على الكلام • البرامج التعليمية. • برامج التخاطب مع الروبوت الذكي. • الإملاء الصوتي. • البرامج التي تتقبل بعض الأوامر المحددة بواسطة الصوت. • دليل الهاتف الآلي. • الهواتف للصم. • التعرف على الأسماء في الهواتف المحمولة.
المبادئ والأدوات المستخدمة • مبدأ ماركوف المخفي ( Hidden Markov Model ) . • مكونات بناء HMM للتعرف على الكلام: • عدد الحالات في القالب وترمز بــ ( N ) • M وهو يمثل عدد الملاحظات المختلفة التي سوف يلاحظها القالب في كل حالة. • احتمالية الإنتقال من حالة إلى حالة أخرى وترمز بــ (A). • احتمالية رؤية ملاحظة معينة في الوقت t في الحالة الحالية وترمز بــ (O). • احتمالية الحالة الابتدائية وترمز بــ π.
2 1 3 ميكانيكية عمل HMM للتعرف على الكلام
التقنيات المستخدمة للتعرف على الكلام العربي • طريقة الكلمة الكاملة. • طريقة المقاطع. • ويركز فيها على : • الحروف الساكنة وحروف العلة. • أنماط المقاطع من ساكنة C ومتحركة V . CV, CVV, CVC, CVVC, CVCC
التحديات التي تواجه برامج التعرف على الكلام العربي • انتشار اللغة العربية. • تعدد اللهجات العربية. • عدم توفر قاعدة بيانات للصوتيات العربية. • برامج الإملاء الصوتي.
الفرق بين التعرف على الكلام والتعرف على الصوت • التعرف على الكلام: • يهتم باللغة ومفرداتها. • أوسع انتشارا. • أسهل في التمثيل. • حصة السوق في 2005: 96.2% • يسمح بنسبة خطأ أكبر. • التعرف على الصوت: • يهتم بالمتحدث نفسه. • أقل انتشارا. • أصعب في التمثيل. • حصة السوق في 2005: 0.7% • لا يسمح بنسبة خطأ كبيرة.
الفرق بين التعرف على الكلام العربي والإنجليزي • الفرق في خصائص اللغة نفسها وليس في التقنيات المستخدمة. • مخارج الحروف. • سرعة القراءة. • برامج التعرف على الكلام الإنجليزي أفضل وأقوى من برامج التعرف على الكلام العربي, بسبب: • تأخّر البحوث في اللغة العربية. • اللهجات العربية أكثر من اللهجات الإنجليزية.
بعض البرامج والجهود في التعرف على الكلام الآلي • IBM Via Voice: 92-97% • صخر ASR 4.0: 95% • بعض الجهود: • KACST & IBM. • فيليبس و شركة اتصالات الإمارات.
الخاتمة • المستوى الحالي لبرامج التعرف الآلي على الكلام العربي. • الحاجة إلى التطوير. • دخول برامج التعرف الآلي على الكلام العربي في مختلف المجالات.
شكرا ً للاستماع . . . أسئــــلــــة ؟؟