200 likes | 394 Views
التعرف على الكلام العربي. إعداد : عبدالله جميل القرارعة من قسم علوم الحاسب. مقدمة. مسار المحاضرة : اللغة العربية. مبررات النظام. الطرق المتبعة. المشاكل. مثال. المشاريع والإسهامات. خاتمة. العربية. 250 مليون، تمثل اللغة الأم بالنسبة لهم. أكثر من 750 مليون ....بسبب الاسلام.
E N D
التعرف على الكلام العربي إعداد : عبدالله جميل القرارعة من قسم علوم الحاسب
مقدمة • مسار المحاضرة : • اللغة العربية. • مبررات النظام. • الطرق المتبعة. • المشاكل. • مثال. • المشاريع والإسهامات. • خاتمة.
العربية • 250 مليون، تمثل اللغة الأم بالنسبة لهم. • أكثر من 750 مليون ....بسبب الاسلام. • أكثر المراجع الموجودة غير عربية.(شر البلية ما يضحك).
مبررات النظام • مشكلة التعامل مع الأجهزة ..... والحاجة الى تدريب الكوادر. • الكلام هو الوسيلة الطبيعية للتواصل ..... امكانية الاستغناء عن البصر واليدين في التعامل مع الآلة. والتواصل عن بعد مع الحواسب.(بنوك أو شركات) • أهداف صناعية و سياسية وثقافية.
الطريقة التحليلية • يتعرف على الكلام عن طريق تحليل الأصوات.... • تتطلب معرفة كل الأصوات صوتا صوتا.(أمر معقد) • مثال: يجد و يجد و يجيد....سرعة الكلام وطوله و جنس المتكلم.....وغيرها. • الصوت في أول الكلمة أطول من الصوت في آخر الكلمة. • التغيير في المدى الزمني.
تابع الطريقة التحليلية • مشكلة الأصوات المطبقة في اللغة العربية، كالطاء أو الصاد وصعوبة التفريق بينهما. • تتطلب هذه الطريقة الاستعانة بالتركيب والصرف والدلالة لتجنب الخطأ. • مشاكل اللهجات واللكنات.....
الطريقة الكلية • تعتبر أكثر نجاحا من الطريقة التحليلية. • تعتمد طريقة التعرف على الكلمة دون تحليلها لتفادي المشاكل السابقة. • تتطلب تخزين الأشكال السماعية للكلمات.(مسبقا) • بعد ذلك يقارن النظام بين الكلمة المنطوقة والكلمات المخزنة للتعرف على الكلمة. • ثلاث طرق.
تابع الطريقة الكلية • كلمات منفصلة ومتكلم واحد: • عدد محدود من الكلمات . ويجب الفصل بينها. • يجب تدريب النظام على صوت واحد. • كلمات منفصلة وأكثر من متكلم: • تستعمل معجم محدود. • كلمات غير منفصلة.
Gulf Arabic Egyptian Arabic Modern Standard Arabic (MSA) Levantine Arabic North- African Arabic مشاكل النظام
تابع مشاكل النظام • وجود الحركات (التشكيل) في اللغة العربية.... مما يعني وجود أكثر من (كلمة/ معنى) لنفس الكلمة. • الفرق بين الكلمة المنطوقة والمكتوبة.....
مثال عملي • Phraselator ....من شركة Vox Tec • دعم الشركة من قبل وزارة الدفاع الامريكية. • عربي / كردي ... • تم تجربته في أفغانستان ب 4 لغات. • يعتمد طريقة ترجمة المقاطع(Phrases) يتسع الى 30000 مقطع صوتي. • يصنف ضمن ال Phrase matcher وليس ضمن المترجمات.
تابع مثال عملي • حقق نجاحه خلال تجربته في العراق ...ولكن لم يستخدم على نطاق واسع.... حوالي 200 جهاز. • تتوقع الشركة أن تطرح منه نسخ تجارية في المستقبل.... لأكثر من لغة.
المشاريع والإسهامات • IBM أول من أنشأ نظام للتعرف على الكلام العربي وتحويله الى نص. (OS2) • بعد ذلك اصدارين لنظام ويندوز • بعد ذلك طرحتVia Voice mulineum .التعرف على الكلام في نظام آلي للرد على المكالمات الهاتفية، والاستجابة لأوامر المستخدم الصوتية. • المشكلة كانت: الحاجة إلى عدد كبير من الكلمات، يبلغ 200000 كلمة لتغطية 97% من اللغة المستخدمة في الحديث اليومي.
تابع المشاريع والإسهامات • محركLASR من صخر. • النسخة 4.0 من برنامج ASR (Arabic Speech Recognition). • يسمح محرك التعرف الآلي على الكلام لأنظمة IVR (أنظمة الاستجابة الصوتية) بالتعرف على الكلام العربي الطبيعي المنطوق بلهجات عربية مختلفة. • يوفر المحرك دقة غير مسبوقة تتجاوز 95 من 100(حسب موقع صخر).
خاتمة • تكلمنا عن : • مقدمة .... • الدوافع وراء وجود النظام. • شرح لطريقتين من طرق التعرف على الكلام العربي. • معوقات النظام. • مثال. • الإسهامات.
المراجع • Novel Speech Recognition Models for ArabicThe Arabic Speech Recognition TeamJHU Workshop Final PresentationsAugust 21, 2002. • Voice Recognition Technology in Iraq. • المعالجة الآلية للكلام المنطوق : التعرف والتأليف ...للدكتور سالم الغزالي.