تغطية شاملة

تتيح شركة IBM لمجتمع البحث مليون صورة مشفرة للوجه لتحسين أنظمة التعرف على الوجه

מעבדות המחקר של IBM מעמידות לרשות קהילת המחקר העולמית אתDiversity in Faces – ערכה המכילה נתונים על מיליון תמונות פנים שעברו תהליך קידוד • ד”ר איה סופר, סגנית נשיא למחקר טכנולוגיות בינה מלאכותית ב-IBM העולמית: “ערכת הנתונים תסייע בפיתוח מערכות בינה מלאכותית הוגנות كثير. وهذه دعوة لمجتمع البحث العالمي للمساهمة في استمرار البحث في هذا المجال وتعزيز هذه القضية المهمة"

صورة مشفرة للتعرف على الوجه. الصورة: آي بي إم
صورة مشفرة للتعرف على الوجه. الصورة: آي بي إم

تظهر تطبيقات الذكاء الاصطناعي اليوم قدرات محسنة بشكل متزايد لأداء مهام معالجة البيانات المعقدة، على سبيل المثال تحويل الكلام إلى نص، وترجمة السياقات والأشياء والصور أو التعرف عليها. تعتمد هذه التطبيقات على استخدام التعلم العميق والتعامل مع كميات هائلة من البيانات بغرض إعداد نماذج أكثر دقة - ولكن قوة هذه التقنيات تكون أيضًا في بعض الأحيان نقطة ضعفها.

تتعلم أنظمة الذكاء الاصطناعي ما يتم تدريسه: إذا كانت عملية التعلم (المعروفة باسم "التدريب") لا تعتمد على مجموعات بيانات متنوعة بما فيه الكفاية، فقد تتعرض دقة وعدالة الرؤى التي تنتجها هذه الأنظمة للخطر. يتم التعبير عن التحدي المتمثل في تدريب أنظمة الذكاء الاصطناعي بشكل أوضح عندما يتعلق الأمر بتقنيات التعرف على الوجه. هناك صعوبة في بناء مثل هذه الأنظمة التي تلبي التوقعات فيما يتعلق بالعدالة.

جوهر المشكلة ليس تكنولوجيًا، بل الطريقة التي يتم بها تدريب الأنظمة. ولكي تعمل هذه الأنظمة كما هو متوقع، ولكي تصبح النتائج التي تنتجها أكثر دقة بمرور الوقت، يجب أن تكون المعلومات المستخدمة لتدريب الأنظمة متنوعة وتوفر تغطية لأكبر قدر ممكن من التنوع البشري. يجب أن تكون مجموعات البيانات المستخدمة لتدريب النظام شاملة ومتنوعة بما يكفي حتى تتمكن التكنولوجيا من التعرف على جميع الطرق التي تختلف بها الوجوه البشرية عن بعضها البعض، وتحديد تلك الاختلافات بدقة في مجموعة واسعة من المواقف. يجب أن تعكس بيانات الصورة توزيع وتنوع ملامح الوجه كما نراها حول العالم.

وهذا هو السبب وراء قيام شركة IBM الآن بتسخير قوة العلم لتطوير أنظمة ذكاء اصطناعي أكثر عدالة ودقة. في هذه الأيام، يقوم قسم الأبحاث في شركة IBM بإتاحة التنوع في الوجوه لمجتمع البحث العالمي - وهي مجموعة بيانات تتضمن بيانات مشفرة لمليون صورة مجهولة لوجوه البشر، تم اختيارها باعتبارها أكثر الممثلين ملاءمة للتنوع البشري من قاعدة بيانات عامة تضم 100 مليون صورة. صور الوجه (قاعدة بيانات YFCC100M). تم ترميز المليون صورة الموجودة في المجموعة باستخدام عشر طرق ترميز مستقلة موثقة في الأدبيات العلمية. وهذه هي مجموعة البيانات الأولى من نوعها المتاحة للاستخدام المجاني من قبل مجتمع البحث والتطوير العالمي والغرض من إتاحتها للباحثين هو تعزيز البحث في مجال عدالة ودقة تقنيات التعرف على الوجه.

يتضمن ترميز الصور في المجموعة قياسًا موضوعيًا للوجوه البشرية، مثل بنية الجمجمة - الطول الإجمالي وطول الأنف وارتفاع الجبهة وأوصاف أكثر ذاتية مثل التقييم اللفظي من قبل البشر حول عمر الشخص المصور وجنسه. الذي ينتمي إليه.
كيف نقيس ونضمن التنوع المطلوب للوجوه البشرية؟ أولاً، نعرف كيف تختلف الوجوه بين الأعمار أو الجنسين أو لون البشرة، وكيف يتم تعريفها ضمن هذه الخصائص. ولكن كما أظهرت الدراسات السابقة أيضًا، فإن هذه المتغيرات ليست سوى جزء من المجموع الكلي، وليست كافية لوصف المجموعة الكاملة للوجوه البشرية. تعتبر الأبعاد مثل تناسق الوجه والتباين وموضع الوجه وطول وعرض المكونات المختلفة (العينين والأنف والجبهة) مهمة أيضًا.

وقالت الدكتورة آية سوفير، نائب رئيس أبحاث تكنولوجيا الذكاء الاصطناعي في شركة IBM في جميع أنحاء العالم: "تفتخر شركة IBM بتوفير الوصول إلى مجموعة البيانات الجديدة بهدف تعزيز البحث الجماعي والمساهمة في إنشاء أنظمة ذكاء اصطناعي أكثر عدالة". "بينما تلتزم IBM Research Labs بمواصلة البحث عن أنظمة أكثر عدالة للتعرف على الوجه، فإننا لا نعتقد أنه يمكننا القيام بذلك بمفردنا. إن إتاحة مجموعة البيانات لمجتمع البحث العالمي هو بمثابة دعوة للآخرين للمساهمة في استمرار البحث في هذا المجال وتعزيز هذه القضية المهمة على جدول أعمال العالم العلمي."

لموقع تقييم مخصص للمجتمع العلمي

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.