اللغة العربية بعيدة من اللغة الثنائية الالكترونية ... الترجمة المؤتمتة تطوّرت مع تقدم الذكاء الاصطناعي للكومبيوتر

 

 

غسان مراد

 

تعني الترجمة المؤتمتة Automated Translation، أي تلك التي تنهض بها برامج الكترونية متخصصة في التعامل مع اللغات وأساليب الترجمة، أن مستعمِل الحاسوب يستطيع أن يستخدم نظاماً معلوماتياً يترجم له نصاً أو مجموعة من النصوص أو موقعاً معيّناً على الانترنت بصورة آلية ومن دون مساعدة المستعمِل.

في البداية لا بد من القول إن أنظمة الترجمة المؤتمتة ليس باستطاعتها أن تحلّ مكان المُترجم المتخصص، ومحاولة استعمالها لهذا الغرض غير مجدية حالياً. فحتى الآن لا يوجد نظام ترجمة آلي باستطاعته أن يترجم ولو في شكل مقبول نسبياً، نصاً لغوياً.

وفي المقابل، تقدم أنظمة الترجمة المؤتمتة مُساعدة لا يُستهان بها لكل مستعمل للحاسوب يريد أن يفهم نصاً معيناً كُتب بلغة أخرى، سواء كان يعرفها أم يجهلها. فمثلاً باستطاعتنا استخدام الترجمة الآلية لأخذ فكرة عن موضوع طبي مكتوب باللغة الإسبانية حتى من دون أن يكوّن لنا إلمام بتلك اللغة. فنظام الترجمة الآلي سيعطينا نصاً مترجماً نفهم من خلاله المعنى العام لما كُتِب فيه.

وتُشير إحصاءات مستعملي الترجمة الآلية إلى أن سرعة الحاسوب الحالي والتطوّر الحاصل في مجالات البرامج المعلوماتية وفي مجال علم اللغات وعلم المعلوماتية ستسمح لنا بأن نحصل على ترجمة خمسين صفحة خلال خمس دقائق، وتكون نسبة فهم الجُمَل في هذا النص 50 في المئة، كما تصل نسبة الفهم العام للنص الى 80 في المئة.

وبامكاننا تحسين الأمور بالعمل على النص المُترجم، بمعنى التأمل في الجُمل ومعانيها وسياقاتها ومنطقها، ما يساعدنا، خلال ساعة من ذلك العمل، أن نحصل على نسبة 70 في المئة من الجمل المفهومة جيداً وعلى فهم النص بنحو 80 في المئة.

وفي المقابل، فإن ترجمة النص عينه من قِبَل مترجم متخصص، تستلزم نحو 5 أيام من العمل، لكي نحصل على نسخة جيدة مترجمة بطريقة صحيحة ومفهومة كلياً.

وتكمن أهمية هذه الترجمات في أنّها مفيدة في شكل خاص للشركات التي تسعى الى فهم بعض المواضيع في شكل سريع، ما يعني أنها ليست بحاجة إلى ترجمة تامة وجيدة، في معظم الأحيان. فنظراً الى تكاثر الشركات المتعدّدة الجنسيات والعابرة للقارات حالياً، صارت الترجمة الآلية حاجة مُلحة لتبادل النصوص والرسائل بين العاملين في الاسواق الدولية. وأوجب هذا الوضع وجود ترجمة آلية لتُساعد على حلّ بعض العقد اللغوية بين أطراف العمل.

ويمكن تلخيص ما سبق بالقول أن الترجمة الآلية لا تُعطي إلاّ ترجمة تقريبيّة، وأنها تُستعمل لأخذ نظرة عامّة عن النص. وكذلك فإن الترجمة الآلية هي نظام معلوماتي يترجم نصاً من لغة الى أخرى، كما أنها تسمح بأن نفهم المواضيع المترجمة في شكل سريع وتقريبي.

النظام المباشر

أدى انتشار الكومبيوتر والإنترنت إلى وفرة في المعلومات المتداولة ما ولّد الحاجة إلى فهم كثير من النصوص بسرعة، ولو في صورة تقريبية. إذ أن أكثر من 70 في المئة من المعلومات المتوافرة على الإنترنت حالياً مكتوبة باللغة الإنكليزية، والـ 30 في المئة المتبقية موزعة على اللغات الباقية. إن تحوّل الشبكة الالكترونية الدولية الى نوع من «برج بابل» مُعاصر وحَتّمَ هذا الوضع ايجاد وسيلة لتجاوز التعدّد اللغوي بطريقة سهلة وعملية وسريعة.

إن عملية الترجمة الآلية تتطلّب كمية هائلة من المعلومات والأنظمة المعلوماتية. وفي هذا السياق، تبرز 3 متطلبات أساسية لهذا النوع من الترجمة: قواعد لغويّة مُصاغة في شكل عملاني، وقواميس تحتوي على معلومات تفصيلية عن المفردات اللغوية، وأخيراً، واجهات عمل رقمية «للتحاور» بين مستعمِل الحاسوب ونظام الترجمة.

وهناك نظامان أساسيان من الترجمة الآلية (أنظر الاطار «تاريخ الترجمة المؤتمتة»): مباشر وغير مباشر.

في «الترجمة المباشرة» يتولى الكومبيوتر الترجمة بطريقة «فظة»، بمعنى ترجمة النص مُفككاً الى كلمات مستقلة، ثم اعطاء المعنى الأكثر شيوعاً لكل كلمة على حدة، أو بالأحرى بعد أن ينظر برنامج الكومبيوتر في الجملة الصغيرة التي تأتي فيها الكلمة.

وبذا، لا يستطيع هذا النوع من برامج الترجمة تكوين فكرة عامة عن النص ومعناه. وتعاني تلك الترجمة من مشاكل منها:

1 ـ تشكيل الكلمات: مثلاً «ذهب» و «ذهب». هل تعني كلمة «ذهب» فعل الذهاب أم اسم المعدن الأصفر.

2 ـ تعددية المعاني: ففي عبارة «ركب الحصان» تختلف كلمة «ركب» عن معناها في عبارتين مثل «ركب البحر» أو «ركب السفينة».

 وبسبب هذه المشكلات أُلغيت هذه الطريقة في صنع برامج للترجمة المؤتمتة لأنها لم تعط أية نتيجة.

النظام غير المباشر

تجرى هذه العملية عبر المرور بالمرحلة التمثيلية «الوسيطة» للنص. (أنظر الاطار: «تاريخ الترجمة المؤتمتة»). وتعتمد على فصل عملية التحليل للنص المطلوب ترجمته عن عملية صناعة النص المُترجَم. ولأن اللغة «الوسيطة» هي لغة مجرّدة، باعتبارها لغة الكترونية مُكوّنة من أرقام متسلسلة، يمكن استعمالها للترجمة الى لغات عدّة.

لا يقرأ الكومبيوتر أي شيء، إلا بعد تحويله إلى مجموعات مُنظّمة من الارقام، وتحديداً يجب كتابته بتكرارات من الصفر والواحد، وذلك ما يُسمى اللغة الثنائية Binary Language وقد ابتكرها الفيلسوف الالماني غوتفريد لايبنيز في القرن السابع عشر. لقد وُضعت اللغة الثنائية بالاصل لتكون طريقة في كتابة الأعداد، بمعنى كتابة الاعداد كلها باستخدام رقمي الصفر والواحد. فمثلاً، يُكتب الواحد 01، والاثنين 10 والثلاثة 11 والاربعة 100 والخمسة 101 والسته 110 والسبعة 111 وهكذا دواليك. ومع توسّع استخدام الكومبيوتر، كُتبت الكلمات بطريقة كتابة الاعداد نفسها. ووجد العلماء طريقة لكتابة الاحرف برقمي الصفر والواحد. ووضعوا لذلك قواعد واضحة، ما مكّنهم من كتابة الكلمات والجُمل والنصوص برقمي الصفر والواحد أيضاً. ولأن الكومبيوتر وُلد في الغرب، لم تظهر صعوبة في كتابة اللغات ذات الاصل اللاتيني بالارقام الثنائية. ومع توسّع ثورة المعلوماتية في العالم، كُتب الكثير من لغاته بتلك اللغة أيضاً. لم تواجه اليابانية مثلاً، على رغم غياب الحروف عنها، صعوبة في التحوّل إلى اللغة الثنائية. والأرجح ان الاسهام الياباني الهائل في صناعة المعلوماتية، لعب دوره في ذلك الامر. والمفارقة ان اللغة العربية تواجه صعوبة هائلة في التحوّل إلى اللغة الثنائية، على رغم ان الصفر اكتشاف عربي أصلاً. ولعل غياب العرب عن المساهمة في الثورة العلمية التي رافقت الكومبيوتر والانترنت شكّل السبب الرئيس في هذا الوضع. 

ويمكن اعتبار تلك النصوص الرقمية نوعاً من اللغة المحورية، التي تتعامل معها برامج الترجمة بطريقتين:

الطريقة الأولى:

البدء بعملية التحليل، ثم المرور الى اللغة المحورية لكتابة التحليل بلغة الأرقام، ثم تحويل تلك الأرقام الى اللغة المُتَرجَم اليها. وهذا يعني أن نقوم بالتحليل الشكلي والنحوي والدلالي في شكل متكامل، ثم استعمال لغة الأرقام لبناء النص المُتَرْجَم.

ويُفضّل العاملون في مجال الذكاء الاصطناعي هذه الطريقة لانها تستند الى فهم النص قبل ترجمته. إن البرامج الالكترونية التي أُنتجت بهذه الطريقة بقيت أداة في يد المتخصصين، بالنظر الى تعقيدها.

الطريقة الثانية:

ترتكز الطريقة الثانية الى تحويل النص المطلوب ترجمته الى اللغة الوسيطة (أي الأرقام الثنائية)، ثم تحويل النص الرقمي الى اللغة الثانية (المُترجم اليها)، مع مراعاة التحليل النحوي والدلالي للجمل في العمليتين.

إن مستوى التجريد في هذه الحال ليس بعمق المستوى في النظام الأول. ويُسمّى هذا البناء «البناء بالتحويل». أمّا الطريقة الأولى فتسمى «البناء باللغة المحور».

إن مراحل تحليل معالجة النصوص، خصوصاً الترجمة، تتطلب تحليل المعارف الألسنية الكلاسيكية مثل تحديد الكلمات والمصطلحات وتحديد مجموع المعلومات الملازمة ودرس الجمل نحوياً وتحديد الوظائف النحوية في بناء الجملة والنحو المعمق؛ ودلالات المفردات أي صلب المعنى للكلمة المفردة.

هذه الدراسات المختلفة تتم من خلال القواميس المختلفة وقواعد اللغات.

مشاكل الكترونية للغة العربية

راهناً، لا يجد الكومبيوتر صعوبة في التعامل مع الترجمة من اللغات اللاتينية واليها، ما يُظهر أهمية التمكّن من لغتي المصدر والهدف. وهذا ما يخوّل البرمجيّات ترجمة العبارة الفرنسيّةil pleut des cordes بما يقابلها بالانكليزيّة، أي it’s raining cats and dogs وليس بعبارة «حرفية» من نوع it’s raining ropes . كما يُبيّن المثال، أهمية الأمور التي مرّ ذكرها أعلاه مثل عدد قواعد البيانات اللغويّة التي تضمّها البرمجيّات، ونوعيّة هذه القواعد. ويضع اللغويّون هذه القواعد ثمّ تترجم على شكل أعداد رقمية ثنائية. ويهدف هذا الأمر إلى إلغاء الالتباس في الكلمات قدر الإمكان، عبر تقليص الاحتمالات في ترجمة الكلمات، والتي يفترض بالبرمجيّات المُفاضلة بينها. ويجب الأخذ في الاعتبار تعدّد معاني الكلمة الواحدة، والتمييز بين الاسم والفعل، والغموض في المعنى للكلمة عينها. ولذا لا تظهر كثير من الترجمات السيئة عند النقل من لغة لاتينية الى أخرى.

ولا ينطبق هذا الوصف على الترجمة المؤتمتة من اللغات اللاتينية الى اللغة العربية، إلا بصفة جزئية. فلربما تمكن الكومبيوتر من ترجمة العبارتين السابقتين، بالانكليزية والفرنسية، بـ «إنّها تمطر بغزارة»، وليس «أنّها تمطر حبالاً» أو «أنّها تمطر كلاباً وهررةً». ولكن، وللأسف، لا يصف ذلك سوى ما يُشبه الاستثناء! فلا تزال لغة الضاد بعيدة من لسان الكومبيوتر، ويزيد هذا الأمر من تعقيد علاقة اللغة العربية مع الترجمة من طريق الكومبيوتر.

إن معظم مشكلات الترجمة المؤتمتة مرتبطة بالنظريات الحديثة وبعملية مراقبة اللغة والوحدات اللغوية، والمشكلات تصبح أكثر عندما تكون الترجمة من لغة إلى لغة أخرى بعيدة عنها، في هيكليتها أو من عائلات لغوية مختلفة، مثلاً مفهوم الحاضر والماضي والمضارع في اللغة العربية ليس كما هو في اللغة الفرنسية أو الإنكليزية.

بالنسبة إلى اللغة العربية فإن هذه المشكلات كلها موجودة، إضافة إلى ذلك مشكلات ترميز الكتابة ومزج أنظمة معلوماتية تحتوي الكتابة العربية (من اليمين إلى الشمال) مع أنظمة تحوي الكتابات اللاتينية (من الشمال الى اليمين).

ويرجع السبب الاساس في ذلك القصور إلى عدم اتفاق العرب مع الهيئات المُشرفة على اللغات الالكترونية وبروتوكولاتها، مثل هيئة «أيكان» ICANN الاميركية، على وضع صيغ ثابتة لتحويل احرف الهجاء العربية الى اللغة الرقمية، التي لا يقرأ الكومبيوتر أي نص إلا عبرها. وفي عام 2005، أسندت هيئة «إيكان» إلى مجموعة بولندية أمر تحويل الاحرف العربية إلى اللغة الثنائية، ما أثار احتجاجاً عربياً واسعاً. وكذلك فان تلك المجموعة لم تتمكن من إنجاز المهمة التي أُسندت اليها.

فعلى رغم التطور التكنولوجي عند استعمال أنظمة الترجمة المؤتمتة، يجب أن يكون في حوزتنا دائماً مجموعة من الأنظمة المساعدة لإظهار الكتابة بشكلها السليم. وثمة الكثير من الشوائب في هذا المضمار. ومن ناحية ثانية، تفتقر الجامعات العربية الى الاختصاصات المتعلقة بمكننة اللغة العربية وبمعالجتها في شكل مؤتمت. وإضافة الى ذلك، فإن معظم المختبرات التي تعمل على هذا الموضوع موجودة في الجامعات الغربية. ويرجع ذلك الى الدور الذي تلعبه عملية الترجمة اقتصادياً، وكذلك الى اعتماد الغرب على مفاهـــيم السوق، بمعنى تركيز آليات البــيع عـــلى لغـــة المُشتري، أي أنه لكي تبيع يجب التكلم بلغة المُشتري أيضاً.

والارجح أن أهم المشكلات التي تُعاني منها أنظمة الترجمة المؤتمتة مبنية على عدم معرفتنا الكافية باللغة وقواعدها، وبالظواهر اللغوية عموماً. فمشكلة العمل على الجملة لا تكفي لفهم النصوص، التي لا تُمثّل مجرد مجموعة من الجمل المتراصفة الواحدة تلو الأخرى. إذاً، يلزمنا اللجوء إلى العمل على النص كوحدة علمية متكاملة. وحتى الآن لا يوجد لدينا قواعد للنصوص من الــممكن أن تكتب في شكل يفهمــها الحــاسوب. ولا يتوافر للغة العربية سوى قــواعد للـــجمل وللمفردات.

أخيراً، المطلوب العمل على صعد مختلفة لحل المشكلات المتعلقة بترجمة هذا الكم الهائل من النصوص الذي تفيض به الانترنت. إذ «إننا نغوص» حالياً في بحر من المعلومات في هذا الفضاء الافتراضي، وعلى كاهل العرب يقع جزء من مسؤولية البحث أيضاً عن حلول، لكي لا تبقى لغتنا خارجة عن هذا النسق عملياً ونظرياً. فلتطويرها يجب دراسها وترجمتها وكذلك... الترجمة إليها!

*استاذ في الجامعة اللبنانية

و كل ذلك بحسب رأي الكاتب في المصدر المذكور نصا و دون تعليق.

المصدر:الحياة اللندنية-12-5-2007