المساحة الإخبارية

البرمجة الاحتمالية قادرة على كتابة برنامج من خمسين سطر بدلاً من الألوف!

مُعظم التّطورات الحديثة في مجال الذكاء الصنعي هي نتيجة لتطور مجال تعلم الآلة Machine Learning، وذلك كتطبيقات الجوال التي تُحوّل الكلام إلى نص (أو تطبيقات التعرف على الكلام Speech Recognition)، حيث تقوم الحواسيب بالبحث ضمن مجموعةٍ ضخمة من البيانات، من أجل الحصول على أنماطٍ مميزة ومفهومة.

ولجعل تطبيقات تعلم الآلة أسهل للبناء، بدأ عُلماء الحاسوب بتطوير ما يُسمى لغات البرمجة الاحتمالية Probabilistic Programming، والتي تُتيح للباحثين مُقارنة ومزج تقنيات التّعلم الآلي والتي عملت بشكلٍ جيد في سياقاتٍ وأوضاع أخرى.

وقد تم في عام 2013 إطلاق برنامج لتمويل بحوث البرمجة الاحتمالية لمدة أربع سنوات، وذلك من قبل وكالة أبحاث الدفاع المتقدمة DARPA في الولايات المتحدة الأمريكية. وسيُثبت باحثو معهد ماساتشوستس للتقنية MIT في مؤتمر الإبصار الحاسوبي Computer Vision والتّعرف على الأنماط Pattern Recognition، الُمقام في شهر يونيو/حزيران، أن لغة البرمجة الاحتمالية في بعض معايير ومهام مجال الإبصار الحاسوبي – حيث يتراوح البرنامج المكتوب أقل من 50 سطر طويل- ما هي إلا لغة تنافسية مع الأنظمة التقليدية ذوات الآلاف من الأسطر من التّعليمات البرمجية.

يقول تيجاس كولكارني، طالب دراسات عليا في معهد ماساتشوستس للتقنية بمجال الدماغ والعلوم الفكرية المعنوية، والمؤلف الأول في البحث الجديد :” هذه هي المرة الأولى التي نقوم بإدخال البرمجة الاحتمالية في مجال رؤيتنا. كما أن الأمل الوحيد هو كتابة نماذج مرنة للغاية برمز احتمالي قصير، في كلا النموذجين التوالدي Generative والتمايزي Discriminative، دون القيام بأي شيء آخر، فمُخططات الاستدلال للأغراض العامة ستقوم بحل المشاكل.”

لكن يمكن أن تبدو تلك النماذج غامضة بشكل غريب وذلك وفقاً لمعايير البرامج الحاسوبية التقليدية، فعلى سبيل المثال – أحد المهام التي درسها الباحثون- هو بناء نموذج وجه إنسان ثلاثي أبعاد 3D من صور ثنائية الأبعاد 2D، فيصف البرنامج الملامح الرئيسية للوجه وذلك بكائنين قد وزّعوا بالتناظر (عينان) مع كائنين آخرين أكثر تمركزاً تحتهما (الأنف و الفم)، وبالطبع هذا يتطلب القليل من العمل لترجمة هذا الوصف في بناء جملة خاصة بلغة البرمجة الاحتمالية، لكن في تلك النقطة، النّموذج يكون قد اكتمل، فبتغذية وتزويد البرنامج أمثلة كافية من صور 2D و نظائرها من نماذج 3D، سيقوم بمعرفة البقية بنفسه!

ويضيف كولكارني أنه عندما يتعلق الأمر بالبرامج الاحتمالية، يكون التفكير حدسي جداً أثناء إعداد النموذج، فلا يتوجه تفكيرك بشكل رياضي، بل إنه أسلوب مختلف من النماذج.

وكان انضمام كولكارني إلى البحث بنصيحة من أستاذه جوش تينينباوم، أستاذ الدماغ والعلوم المعرفية الفكرية، وقد قام كلاً من Vikash Mansinghka، وهو عالم أبحاث في معهد ماساتشوستس للتكنولوجيا في قسم الدماغ والعلوم المعرفية، و Pushmeet Kohli من شركة مايكروسوفت للبحوث في كامبريدج، بإنشاء لغة البرمجة الاحتمالية وأطلقوا عليها اسم الصورة Picture، والتي هي امتداد للغة برمجة أخرى تدعى “جوليا Julia” تم وضعها في معهد ماساتشوستس للتقنية.

ما هو قديم هو جديد!

ذكر كولكارني أن هذا العمل الجديد قد أحيا الفكرة المعروفة باسم الرسوميات العكسية والتي يعود تاريخها إلى نشأة بحوث الذكاء الصنعي، وقد شهد رُواد الذكاء الصنعي على أن برامج الرسوميات ستكون قادرة على تجميع صور واقعية، وذلك على الرّغم من أن أجهزة الحواسيب الخاصة بهم بطيئة جداً مُقارنةً بمقاييس السرعة اليوم، وقد تم ذلك عن طريق حساب الناحية التي ينعكس فيها الضوء من الأجسام الافتراضية، و هذا أساس عمل الـ Pixar في صناعة الأفلام.

لاري روبرتس طالب دراسات عليا في معهد ماساتشوستس للتقنية وأحد الباحثين الذين جادلوا بأن استنتاج الأشكال ثلاثية الأبعاد من المعلومات المرئية كانت في المقابل ببساطة نفس المشكلة، لكن بالإمكان من حيث المبدأ عند تغطية الصورة المرئية ببقعة لون محدد أن يتم إنتاجها من ضوء أي لون قادم من أي اتجاه والمنعكس على سطح اللون المناسب بالاتجاه المناسب، فحساب قيمة لون بكسل في صورة من صور فيلم “Toy Story” ما هي إلا حسابات ضخمة، لكنها حتمية، فالمُتغيرات جميعها معروفة، ومن جهةٍ أخرى استنتاج الشكل هو شيءٌ احتمالي، فهذا يعني فرز الكثير من الاحتمالات المتناظرة والاختيار يقع على الأمثل، وهذا النوع من الاستدلال والاستنتاج هو بالضبط ما صممت لأجله لغات البرمجة الاحتمالية للقيام به.

وقد اعتبر كولكارني وزُملاؤه أربع مشاكل مُختلفة في مجال الإبصار الحاسوبي، وكل من هذه المشاكل شملت شأن استدلال على جسم ذو شكلٍ ثلاثي أبعاد 3D من معلومات ثنائية الأبعاد 2D، ففي بعض المهام، تمكنت البرامج البسيطة من التّفوق بالفعل على الأنظمة السابقة، ونسبة خطأ البرنامج الذي قدّر حالة ووضع الإنسان كانت بين 50 و 80 في المئة على سبيل المثال وهذا يعد أقل من سابقاتها!

معرفة كيفية التعلم

بذلك لاحظنا أنه في لغة البرمجة الاحتمالية قد تم رفع الأحمال الثقيلة أو دعونا نقول قد تجاوزنا الصعوبة من قبل خوارزمية الاستدلال، والتي تقوم بإعادة ضبط الاحتمالات باستمرار، وذلك على أساس أجزاء من البيانات التي تم اختبارها سابقا، وفي هذا الصدد حصل كولكارني وزملاؤه على فائدة عقود من بحوث تعلم الآلة، وقد بُنيت في الصورة مجموعة متعددة من خوارزميات الاستدلال المختلفة والتي تحقق نجاحاً جيداً، و إذا سمح الوقت بذلك، فإنه بالإمكان محاولة تجريب كل هذه الخوارزميات على أي مشكلة لمعرفة ما هي الخوارزمية التي ستعمل بشكلٍ أفضل.

وعلاوةً على ذلك، يقول كولكارني أنه قد تم تصميم “الصورة Picture” بحيث يمكن لخوارزميات الاستدلال الخاصة بها الاستفادة بنفسها من تعلم الآلة، وتعديل نفسها، وبذلك تقوم بالتأكيد على استراتيجيات تبدو أنها تقود لنتائج جيدة، وأضاف أن استخدام التّعلم لتحسين الاستدلال سيكون مهمةً نوعية ودقيقة، لكن البرمجة الاحتمالية قد تُخفف من إعادة كتابة البرنامج في ضوء مشاكل مختلفة، فيمكن للبرنامج أن يكون عام وشامل وذلك إذا كان التّعلم الآلي قوي بما فيه الكفاية لفهم استراتيجياتٍ مُختلفة لمهامٍ متفاوتة.

وقد قال جيان شيونغ شياو، وهو أستاذ مساعد في علوم الحاسب في جامعة برينستون، ولم يكن قد شارك في العمل، أن “الصورة Picture” تُقدّم إطاراً عام يهدف إلى حل ما يقارب جميع المهام في مجال الإبصار الحاسوبي، وهو يتجاوز مهام التصنيف Classification، المهمة الأكثر رواجاً في مجال الإبصار الحاسوبي. كما يحاول الإجابة على أحد الأسئلة الأساسية في الإبصار الحاسوبي والذي ينص على ما هو التّمثيل الصحيح من المشاهد البصرية؟ إنها بداية من معاودة نظر حديثة لمنطق الرسوميات العكسية.

المصدر: Phys.org

مقالات ذات صلة

زر الذهاب إلى الأعلى