ما هو عدد الأوراق العلمية البحثية على الإنترنت ؟
خصص لي جيلز Lee Giles – بروفيسور تقنية المَعلومات في جامعة بنسلفانيا الحكومية – جزءاً كبيراً من مسيرته المهنية من أجل تطوير مُحرّكات بحث ومكتبات رقمية تُساهم بتسهيل مهمة الباحثين من أجل الوصول للأوراق العلمية البحثية المنشورة على الإنترنت. وفي حين أنه يوجد العديد من قواعد البيانات ومُحرّكات البحث التي تقوم بتعقّب الوثائق البحثية وبالتالي تُسهّل من عملية البحث عنها، إلا أن العديد من الباحثين والأكاديميين يشعرون بالقلق حول التوسع الكبير الحاصل بمجال نشر الأوراق العلمية والبحثية على الإنترنت، وقُدرتهم على الوصول لهذه الأبحاث بشكلٍ كامل.
وكجزءٍ من عملٍ تعاونيّ يَهدف لتقدير عدد الوثائق الأكاديمية والعلمية بشكلٍ أكثر كفاءة، قام البروفيسور جيلز بدراسةٍ حول اثنين من أهم محركات البحث الأكاديمية على الإنترنت، وذلك من أجل تقدير عدد الوثائق البحثية المُتاحة على شبكة الإنترنت. وقد قام جيلز بنشر نتائج بحثه (الذي شاركه به طالب الدكتوراه ماديان خابسا) في شهر آذار/مارس من العام الحالي، في مجلة PLOS ONE، وقد تم ذكر ورقته البحثية مرتين في مجلة Nature، فضلاً عن العديد من المُدونات والمواقع الإلكترونية.
وفي البحث المنشور، قام جيلز وخابسا بتقدير عدد الوثائق البحثية المتاحة على الإنترنت عبر دراسة مدى التّداخل في التغطية التي يوفرها اثنين من أهم محركات البحث الأكاديمية: مُحرّك Google Scholar ومُحرّك Microsoft Academic Search. وفي بحثهم، فإن مصطلح “وثائق بحثية Scholarly Documents” يعني الأوراق البحثية المنشورة في المجلات العلمية وفي المؤتمرات، أطروحات ورسائل درجة الماجستير، الكتب، التقارير التّقنية وأوراق العمل. بالنسبة لمُحرّك بحث Google Scholar، فهو محرك بحث للأوراق العلمية، مجانيّ الدخول، وهو يستطيع أن يشير إلى النص الكامل لعددٍ كبير من المنشورات وفي العديد من المجالات. أما بالنسبة لمحرك Microsoft Academic Search، فهو أيضاً محرك بحث مجانيّ للأوراق العلمية والبحثية، وقد تم تطويره من قبل شركة مايكروسوفت للبحث عن الأوراق العلمية في مجالات تتعلق بالخوارزميات، التنقيب عن البيانات Data Mining، إبصار المُعطيات Data Visualization.
عبر استخدام الطّرق الإحصائية، تمكّن جيلز وخابسا من تقدير أنه يوجد حوالي 114 مليون وثيقة علمية بحثية منشورة على الإنترنت، باللغة الإنجليزية وحدها، وتعود 100 مليون وثيقة لنتائج مُحرّك بحث Google Scholar، وقد قدر الباحثان أيضاً أنه يوجد حوالي 27 مليون وثيقة أكاديمية وعلمية متاحة بشكلٍ مجاني، ولا تتطلب شروط تسجيل معينة أو دفع من أي شكل. هذه التقديرات كلها تتعلق بالوثائق المنشورة الانجليزية فقط.
يقول جيلز عن بحثهم هذا :” إنه البحث الأول من نوعه الذي يستخدم الطرق الإحصائية وتقنياتٍ صارمة للوصول لهذه التقديرات “. قام الباحثون باستخدام طريقة Capture-Recapture من أجل الحصول على تقديراتهم، وقد تم بدايةً تطوير هذه الطريقة بمجال العلوم البيئية. تقوم الطريقة باختبار درجة التداخل ما بين اثنين أو أكثر من طرق التثبت، ومن ثم تقوم باستخدام معادلة بسيطة لتقدير الحجم الكلي للتجمع المراد تقديره، وهو بهذه الحالة عدد الوثائق العلمية والأكاديمية.
وفيما يتعلق باهتمام البروفيسور جيلز بتحديد عدد الوثائق العلمية والأكاديمية على الإنترنت، فإنه ليس مجرد فضول: فالبروفيسور جيلز أحد المطورين للعديد من محركات البحث الأكاديمية والمكتبات الرقمية، وبالتالي فهو يجد العديد من الجوانب والآثار التطبيقية لبحثه الجديد. على سبيل المثال، فإن موقع CiteSeer، وهو محرك بحث ومكتبة رقمية مختصة بالأوراق العلمية والوثائق الأكاديمية خصوصاً بمجال علوم الحاسب وأنظمة المعلومات. تم إنشاء موقع CiteSeer من قبل البروفيسور جيلز وزملائه عام 1997، وقد كان الهدف الأساسي من الموقع هو استغلال واستثمار الأوراق البحثية العلمية المنشورة على الإنترنت واستخدام الفهرسة المستقلة Autonomous Citation Indexing من أجل تنظيم صفوف البحث إما عبر الاقتباسات، أو عبر الوثيقة، مما يؤدي لتصنيفها عبر تأثير الاقتباس Citation Impact. يعتبر موقع CiteSeer السلف الأول للمواقع البحثية الحالية مثل Google Scholar و Microsoft Academic Search. وفي عام 2008، تم إطلاق موقع CiteSeerX، والذي تم بناؤه على هيكلية جديدة مفتوحة المصدر، وقد ركز الموقع بالبداية على الوثائق العلمية والأكاديمية الخاصة بمجال علوم الحاسب والمعلوماتية، إلا أنه قد بدأ بالتوسع ليشمل الوثائق الأكاديمية بمجالات الاقتصاد، الطب، والفيزياء.
الآن، ما علاقة هذا كله بالبروفيسور جيلز وبحثه؟ حسناً، يقول البروفيسور جيلز أن الهدف من البحث هو تطوير قدرة موقع CiteSeerX وزيادة عدد الأوراق البحثية التي يستطيع أن يصل إليها.
هذا البحث يمتلك العديد من الجوانب الهامة، فهو يظهر – بشكلٍ تقديري – كمية الأوراق العلمية والوثائق الأكاديمية المتوافرة على الإنترنت، وكمية الوثائق المجانية المتوافرة، كما أظهر البحث أن الوثائق والأوراق العلمية المجانية لها تأثير أكبر بمجال الاقتباسات والذكر، بمعنى أنه يتم طلبها والبحث عنها بشكلٍ أكبر بكثير من تلك التي لا يمكن الحصول عليها بشكلٍ مجاني. وهنالك أمرٌ هام آخر، وهو يتعلق بأن البحث شمل فقط الأوراق البحثية المنشورة باللغة الانجليزية، وبالتالي سيكون هنالك سؤالٌ ملح: هل عدد الأوراق البحثية المنشورة باللغات الأخرى سيكون أكبر أو أقل من عدد الأوراق البحثية والوثائق الأكاديمية المنشورة باللغة الانجليزية ؟
المصدر: Phys.org
يمكنكم الاطلاع على البحث المنشور من: هنا
تعليق واحد