المساحة الإخبارية

خوارزمية التعلم العميق تستطيع دراسة حي ما بشكلٍ أفضل من البشر

يمتلك البشر قُدرةً مَلحوظة على استنتاج المعلومات بناءً على محيطهم. هل هذه المنطقة آمنة؟ أين يمكن أن أجد مكاناً لأركن السيارة؟ هل احتمال وصولي إلى محطة الغاز أكبر باتخاذي اتجاه اليمين أم اليسار عند هذه الإشارة الضوئية؟

مثل هذا القرارات تتطلب منا النظر أبعد
 من “المشهد البصري” ودراسة مَجموعة مُعقدة جداً من المفاهيم وأحكام الوقت الحقيقي. الأمر الذي يطرح علينا السؤال التالي: “هل يمكننا تعليم الحواسيب أن “ترى” بهذه الطريقة؟ وهل يمكنهم بمجرد أن نعلمهم القيام بذلك أن يقوموا به بشكلٍ أفضل مما يُمكننا نحن، أي البشر؟

الإجابات هي: “نعم” و “بعض الأحيان”، وذلك وفقاً لبحثٍ علمي قام به مختبر علوم الحاسوب والذكاء الصنعي في معهد ماساتشوستس للتكنولوجيا MIT. وقد طوّر الباحثون خوارزميّة يمكن أن تنظر إلى زوجٍ من الصور وتتفوق على البشر في تحديد أمور مثل أي الصورتين تَمتلك مُعدّل جريمة أعلى، أو أيّهما أقرب إلى مطعم ماكدونالد.

يقوم عرض توضيحي على الإنترنت بوضعك في مشهدٍ من برنامج Google Street View (صورة واقعية لشارع بحيث يمكنك رؤية الاتجاهات الأربعة)، ويتحداك أن تنتقل إلى أقرب مطعم ماكدونالد بأقل عدد ممكن من الخطوات.

على الرغم من أن البشر أفضل بشكل عام من الخوارزمية في هذه المهمة بالتحديد، وجد الباحثون أن الحاسوب قد تفوق باستمرار على البشر بالشكل الآخر للمهمة حيث يُعرض على المستخدمين صورتين ويتم سؤالهم أي المشهدين أقرب إلى ماكدونالد.

لإنشاء الخوارزمية، قام الفريق – الذي يتكوّن من طلبة الدكتوراه أديتيا خوسلا وبيونغكون آن وجوزيف ليم وكذلك الباحث الرئيسي في مختبر الذكاء الصنعي (CSAIL) أنتونيو تورالبا – بتدريب الحاسوب على مجموعة تحوي 8 ملايين صورة من غوغل عن 8 مدن رئيسية في الولايات المتحدة والتي تم ربطها ببيانات نظام تحديد المواقع حول معدلات الجرائم وأماكن مطاعم ماكدونالد. بعدها استخدموا تقنيات التعلّم العميق لمساعدة البرنامج على تعليم نفسه كيف يمكن لخصائص مختلفة في الصور أن ترتبط ببعضها. على سبيل المثال، اكتشف البرنامج بشكل مستقل أن الأشياء التي تجدها غالباً قرب علامة ماكدونالد تشمل سيارات أجرة وسيارات شرطة وسجون. (الأشياء التي لا تجدها هي المنحدرات والجسور المعلقة والحواجز الرملية).

” تم تطبيق هذا النوع من الخوارزميات على جميع أنواع المحتوى، كاستنتاج قابلية تذكر الوجوه في الصور الشخصية،” كما قالت خوسلا. ” لكن قبل ذلك، لم يتواجد في الحقيقة أبحاث أخذت مجموعة كبيرة من الصور بهذا الشكل واستخدمتها للتنبؤ بميزات المواقع المحددة التي تمثلها الصور”.

قدم الباحثون ورقة بحثية عن العمل في مؤتمر IEEE الدولي عن الإبصار الحاسوبي والتعرف على الأنماط (CVPR) هذا الصيف.

رغم أن هدف المشروع كان في غالبه إثبات قدرة خوارزميات الحاسوب على الفهم المتقدم للمشهد، قامت خوسلا بعصف ذهني ذاكرةً بعض الاستخدامات المحتملة للمشروع والتي تتراوح بين تطبيقٍ لتحديد المواقع يتجنب الأماكن ذات معدل عالٍ للجريمة، إلى أداةٍ قد تساعد على تحديد مواقع الفروع المستقبلية. 

ترجمة وإعداد: Ghalia Turki

المصدر: موقع Phys.org

مقالات ذات صلة

زر الذهاب إلى الأعلى