بات جديراً باللغة العربية أن تواجه ثورة المحتوى الرقمي، سواء من حيث الدعم أو التطبيق، ولعل ذلك يعود إلى عدد من الأسباب، أهمها النسب الجيدة لمتصفحي الإنترنت العرب وتزايد عدد المستفيدين من التقانة الإلكترونية.

على هامش مؤتمر المحتوى الرقمي العربي الأول موقع eSyria التقى الدكتورة "أميمة دكاك" بتاريخ 14/6/2009 وكان لنا معها الحوار التالي:

  • إلى أين يتجه مسار دعم اللغة العربية في المحتوى الرقمي العالمي، ومن هم الداعمون؟
  • الدكتورة "أميمة دكّاك"

    ** هناك عدد من الداعمين لمحتوى اللغة العربية الرقمي منهم من كان غرضه من الدعم مبني على حقّ من خلال إعطاء جهد أكبر لخدمة اللغة العربية بغية خدمة الأجيال القادمة، ومنهم من كان يقصد الباطل في دعمه للغتنا بغية التعرف على مكوناتنا الثقافية بقصد محاربتها.

  • شاركت بورقة عمل باسم المعهد العالي للعلوم التطبيقية.
  • ** تجارب وأعمال كثيرة بدأ فيها المعهد العالي التقني وما زال حتى الآن يطور فيها، منها ما يعنى بدعم المعالجة النصية، والتحليل الدلالي بمعنى فهم المعنى الذي يحمله النص المكتوب، بالإضافة إلى دعم برامج النطق باللغة العربية، وتعرّف اللغة العربية ككلام ولدينا تطبيقات محددة تعريف الكلمات المنفصلة والمتصلة وتعريف المتكلّم أو ما يسمى بصمة الصوت وما زال لدينا الكثير من الإنجازات التي يجب أن نحققها فيما يتعلق بالكلام المستمر.

  • ما هي الإفادة التي من المنتظر أن يحققها هذا الدعم للغة العربية المنطوقة؟
  • ** إن وضع لغة للتأشير كلغة مثل لغة SSML للغة العربية من الممكن أن تساعد على تعلم النطق باللغة العربية وكما تساعد ذوي الاحتياجات الخاصة ليكتبوا ما يعجزون عن قوله للآخرين، حيث يقوم الحاسب بنطق ما يكتب وهي خدمة هائلة بالنسبة للمكفوفين.

    كما تم توليد ما يسمى "تنغيم خشن" حيث استخرجنا سمات التنغيم لأكثر من /300/ جملة منطوقة باللغة العربية بأطوال مختلفة ودلالات مختلفة وسياقات مختلفة، حيث جرى إعادة تعريف مفهوم طول الجملة باستخدام المجموعات العائمة، وتمت نمذجة منحنيات سمات التنغيم من النتائج الإحصائية.

  • كيف يمكن توليد الإحساس المرافق للجملة حتى تصل الجملة بمدلولات أكثر؟
  • ** من التجارب التي نفذها المعهد العالي التقني هو تجربة توليد المشاعر حيث تم تسجيل مدونة لخمسة مشاعر هي الفرح والغضب والحزن والخوف والدهشة، مع تسجيل موافق خال من المشاعر، كما تم إجراء قياسات على التنغيم مع تغيرات التردد الأساسي والمدة وشدة الصوت باستخدام برمجيات Praat المفتوحة المصدر، وتركيب وجه يحمل هذه المشاعر.

  • تنوع مفردات اللغة العربية ألا يعتبر عقبة أمام مشروع دعم المحتوى الرقمي للغة العربية؟
  • ** طبقنا نظام الاشتقاق على الأعمال المتعلقة بإحصاءات اللغة التي جرت سابقاً في المعهد وتضم /5588/ جذراً من الأفعال الثلاثية وأبوابها، و/1932/ جذراً من الأفعال الرباعية بالإضافة إلى /11790/ مصدراً سماعياً.

    وكان المعهد العالي التقني قد ساهم من خلال باحثيه في قاموس المعلوماتية وفي ترجمة كتب المعلوماتية في الجمعية العلمية السورية للمعلوماتية.

    ومن الجدير بالذكر أن الدكتورة "أميمة دكاك" حاصلة على شهادة الهندسة من المدرسة الوطنية العليا للإلكترونيات والكهرباء الراديوتية عام /1985/، دبلوم في الدراسات المعمقة في العام نفسه في إلكترونيات النظم، ثم دكتوراه عام /1988/ في النظم الإلكترونية في مجال تركيب الكلام اعتماداً على السياق.