المساحة الإخبارية

جوجل تحوّل مشكلة ترجمة اللغات إلى مسألة في الأشعة الفراغية

يقول فريق من مُهندسي شركة غوغل :” لكي تُتَرجم لُغة إلى أخرى، فما عليك إلا أن تَجد التّحويل الذي يربط بين اللغتين”.

علم الحاسوب يُغيّر مَفهوم ترجمة الكَلِمات والجُمل من لغةٍ إلى أخرى، وأي شخص استخدم ترجمة غوغل سيعرف أنها جيدة إلا أنها ليست مثالية.

الفكرة الأساسية هي مقارنة مجموعة من الكلمات في لغةٍ ما مع مثيلاتها من لغةٍ أخرى، حيث أن الكلمات والتّعابير التي لها نفس الخصائص ستكون مُتكافئة.

المُشكلة هي أن التّرجمة الأوليّة تعتمد على قواميس معينة، وهذه القواميس تحتاج إلى أن تتم إعادة تصنيفها برمجياً، وهو أمر يحتاج إلى وقت وجهد كبيرين.

Tomas Mikolov وزملاؤه في غوغل، طوروا تقنية تقوم بتوليد قواميس وجداول من التعابير بشكل ذاتي، بحيث تكون قادرة على الترجمة من لغة إلى أخرى. هذه التّقنية الحديثة لا تعتمد على نفس القاموس للغاتٍ متعددة، إنما تعتمد على تقنية data mining لتمثيل بُنية لغة ما ثم مقارنتها مع بُنية لغة أخرى.

يقول الفريق :”إن هذه الطّريقة تُعطي بعض الأفكار الإضافية عن اللغة، لذلك يُمكن استخدامها في تنقيح المعاجم المستخدمة في الترجمة من لغةٍ إلى أخرى”. إن الوصول لهذه الطريقة يبدو واضحاً، فهي تعتمد على فكرة أن كُل لغة قادرة على التعبير عن مجموعة من الأفكار وستكون الكلمات المستخدمة في اللغات المُختلفة متماثلة. على سبيل المثال كل اللغات تمتلك كلمات لأسماء الحيوانات مثل: كلب، قطة، بقرة…الخ، وهذه الكلمات غالباً ما تُستخدم بنفس الطريقة عند صياغة جملةٍ ما.

تكمن الخدعة بهذه الطريقة في تمثيل كامل اللغة بمجموعة من العلاقات التي تربط بين كلماتها، وتسمى مجموعة العلاقات هذه بـ “فضاء اللغة Language Space” ويُمكن فهم هذا المُصطلح بأنه مجموعة من الأشعة كل واحدٍ منها يشير إلى كلمةٍ ما.

في الآونة الأخير اكتشف اللُغويون إمكانية تمثيل هذه الأشعة رياضياً، مثلاً العملية: (“ملك”-“رجل”+”امرأة”) ستنتج شُعاعاً يُشير إلى كلمة “ملكة”.

تُظهِر هذه الطريقة أن اللغات المُختلفة تَتشابه فيما بينها في فضاء الأشعة هذا، مما يُشير إلى أن ترجمة لغة إلى لغةٍ أخرى تكافئ إيجاد العلاقة التي تحول من فضاء شُعاعي إلى آخر.
هذا الأمر يُحَول التّرجمة من مسألة لغوية إلى مسألة رياضية.

المُشكلة التي تعترض مُهندسي غوغل هي إيجاد طريقة دقيقة لربط فضاء لغةٍ ما بفضاء لغةٍ أخرى، لذلك يستخدمون مُعجم جاهز يحوي نفس الكلمات بلغتين مُختلفتين، مما يُعطِيهم تَحويلاً خَطّياً جاهزاً للاتنقال بين اللغتين.

بعد إيجاد طريقة للربط بين الكلمات، ستُصبح مُشكلة تعميم الطّريقة على فضاء شُعاعي يشمل اللغة كاملةً مسألة سهلة الحل.

يقول Mikolov : “بالإضافة إلى البساطة، إن طريقتنا فعالة بشكلٍ كبير، وتُحَقق حوالي 90% من الدّقة عند التّرجمة بين الإنكليزية والإسبانية”. و يُشير الفريق إلى أن هذه الطّريقة يمكن تطبيقها على اللغات التي لا يوجد فيما بينها أي تقارب، فالإنكليزية والإسبانية لهما جذور هندية-أوروبية مشتركة، أما الإنكليزية و الفييتنامية فلا توجد بينهما مثل هكذا رابطة.

المصدر: مجلة Technologyreview

مقالات ذات صلة

زر الذهاب إلى الأعلى