تغطية شاملة

الذكاء الاصطناعي – حاسبات تفكر بنفسها / ياسر س. أبو متزطبة

التقنيات الجديدة التي تعلم أجهزة الكمبيوتر كيفية التعلم تتفوق على الخبراء

الجزء الداخلي من جهاز كمبيوتر منزلي، من ويكيبيديا
الجزء الداخلي من جهاز كمبيوتر منزلي، من ويكيبيديا

قبل بضع سنوات، اتصل بي مديرو إحدى شركات الملابس النسائية لمساعدتهم على تطوير توصيات أفضل للأزياء لعملائهم. لن يطلب مني أي شخص عاقل توصيات شخصية بشأن موضوع تتجه معرفتي فيه إلى الصفر، فأنا عالم كمبيوتر ذكر. لكن النصيحة التي طلبوها لم تكن شخصية: لقد طلبوا النصيحة في مجال التعلم الحسابي (يسمى أحيانًا التعلم الآلي)، وقد وافقت. واستنادًا إلى بيانات المبيعات واستبيانات العملاء وحدها، تمكنت من التوصية بعناصر الموضة التي لم أرها من قبل لنساء لم أقابلهن من قبل. كانت توصياتي أفضل من توصيات مصممي الأزياء المحترفين، وما زلت بالكاد أعرف شيئًا عن الموضة النسائية.

التعلم الحسابي هو فرع من علوم الكمبيوتر يسمح لأجهزة الكمبيوتر بالتعلم من الخبرة، ويتم استخدامه في العديد من المجالات. يجعل التعلم الآلي نتائج البحث عبر الإنترنت أكثر صلة، واختبارات الدم أكثر دقة، ومن المرجح أن تجد خدمات المواعدة تطابقًا لك. أبسط الخوارزميات في هذا المجال تأخذ مجموعة موجودة من البيانات، وتفحصها بحثًا عن الأنماط، وتستخدم تلك الأنماط للتنبؤ بالمستقبل. ومع ذلك، فإن التقدم في هذا المجال في العقد الماضي قد غيره من النهاية إلى النهاية: فقد جعلت تقنيات التعلم الحسابي أجهزة الكمبيوتر "أكثر ذكاءً" من البشر في العديد من المهام. لنأخذ على سبيل المثال Watson، نظام كمبيوتر IBM الذي استخدم التعلم الآلي لهزيمة أفضل لاعبي Jeopardy في العالم.

ومع ذلك، في المنافسة الأكثر أهمية في هذا المجال، لم تشارك أنظمة الكمبيوتر الناطقة التي تلعب لعبة Jeopardy. قبل بضع سنوات، أرادت شركة تأجير الأفلام عبر الإنترنت Netflix مساعدة عملائها في العثور على الأفلام التي يرغبون فيها - وخاصة الأفلام التي ليست جديدة ومطلوبة، بل الأفلام المنسية المعروضة في كتالوجها. كان لدى الشركة بالفعل نظام توصيات خاص بها، لكن المديرين كانوا يعلمون أنه بعيد عن الكمال، لذلك أعلنوا عن مسابقة لتحسين النظام الحالي. كانت القواعد بسيطة: النظام الأول الذي يتجاوز أداؤه أداء النظام الحالي بنسبة 10%، سيفوز بجائزة قدرها مليون دولار. تم تسجيل عشرات الآلاف من الأشخاص من جميع أنحاء العالم كمشاركين.

بالنسبة للباحث في مجال التعلم الحسابي، تعتبر مثل هذه المنافسة بمثابة فرصة حلم (وليس فقط بسبب الجائزة المالية، بقدر ما قد تكون جذابة). إن العنصر الأكثر أهمية في أي نظام للتعلم الآلي هو البيانات، وقد قدمت منافسة Netflix 100 مليون قطعة من بيانات العالم الحقيقي، جاهزة للتنزيل.

أيام التدريب

استمرت منافسة Netflix لمدة ثلاث سنوات تقريبًا. لقد عالجت العديد من المجموعات المشكلة عن طريق تحليل الأفلام إلى مصفوفات طويلة ذات خصائص مختلفة. على سبيل المثال، يمكنك تقييم أي فيلم على عدة مقاييس: مدى مضحكه، أو مدى تعقيده، أو مدى جاذبية الممثلين. بعد ذلك، تفحص الأفلام التي قام مشاهد معين بتقييمها وترى مدى أهمية كل مقياس بالنسبة له: إلى أي مدى يستمتع بالأفلام الكوميدية، وهل يفضل الحبكات البسيطة أو المعقدة، وإلى أي مدى يحب النظر إلى نجمات السينما الجميلات.

والآن أصبح التنبؤ مهمة بسيطة تتمثل في مطابقة ذوق المشاهد مع خصائص الأفلام. إذا كان المشاهد يحب الأفلام الكوميدية والمؤامرات المعقدة، فمن المرجح أن أفلام مثل "Hot and Taste" أو "سمكة اسمها واندا" ستنال إعجابه. تتطابق الخوارزمية مع العشرات من هذه الخصائص، لذا يجب أن تتنبأ التوصية النهائية جيدًا بمدى إعجاب المشاهد بالفيلم المحدد.

نحن نميل إلى التفكير في الميزات بمصطلحات يسهل التعرف عليها مثل "الكوميديا" أو "الحبكة الملتوية"، لكن الخوارزميات لا تقوم بمثل هذه الفروق. في الواقع، تتم العملية برمتها آليًا ولا يكلف الباحثون أنفسهم عناء تحليل محتوى أي فيلم بأنفسهم. تبدأ خوارزمية التعلم الآلي بميزات عشوائية مجهولة. أثناء قيامه بتجميع بيانات تصنيف الأفلام من قبل المشاهدين السابقين، فإنه يقوم بضبط الميزات حتى تتطابق مع الطريقة التي يقيم بها المشاهدون الأفلام.

على سبيل المثال، إذا كان الأشخاص الذين يحبون الفيلم "أ" يميلون أيضًا إلى الإعجاب بالأفلام "ب" و"ج" و"د"، فسوف تحدد الخوارزمية خاصية جديدة تشترك فيها الأفلام الأربعة. ويتم هذا الإجراء خلال ما يعرف بـ "مرحلة التدريب"، حيث يقوم الكمبيوتر بمراجعة ملايين تقييمات المشاهدين. الهدف في هذه المرحلة هو إنشاء مجموعة من الخصائص الموضوعية بناءً على التقييمات الفعلية وليس على التحليل الذاتي.

في بعض الأحيان سنواجه صعوبة في فك رموز الخصائص المختلفة التي تنتجها خوارزمية التعلم الحسابي. في بعض الأحيان لا تكون واضحة مثل "المحتوى الهزلي". في الواقع، قد تكون دقيقة للغاية وحتى غير مفهومة تمامًا، نظرًا لأن الخوارزمية تحاول فقط العثور على أفضل طريقة للتنبؤ بالتقييم الذي سيعطيه المشاهد للفيلم، وليس أن تشرح لنا كيف يفعل ذلك. إذا كان النظام يعمل بشكل جيد، فإننا لا نصر على فهم كيفية قيامه بذلك.

تختلف هذه الطريقة عن الطريقة التي يعمل بها العالم عادةً. في بداية مسيرتي المهنية، قمت بتطوير نظام للموافقة على أطر الائتمان المخصصة للبنك. وعندما انتهيت طلب مني البنك أن أشرح معنى كل صفة. ولم يكن لهذا الطلب أي علاقة بأداء النظام، والذي كان مرضيًا. كان السبب قانونيًا: لا يستطيع البنك رفض الائتمان لشخص ما دون تقديم سبب منطقي. لا يمكنك إرسال خطاب إلى شخص ما يفيد برفض طلبه لأن X أقل من 0.5.

تعمل أنظمة التعلم الآلي المختلفة على تطوير مجموعات فريدة من الخصائص. في الأسابيع الأخيرة من مسابقة Netflix، بدأت المجموعات التي تعمل بشكل مستقل في دمج خوارزمياتها باستخدام أساليب تُعرف باسم "تقنيات التجميع". وفي الساعة الأخيرة من المسابقة التي استمرت ثلاث سنوات، كان هناك فريقان يتنافسان على الجائزة. أظهرت لوحة النتائج أفضلية صغيرة لفريق The Ensemble، وهو فريق ضم درجة الدكتوراه من مجموعتي البحثية في معهد كاليفورنيا للتكنولوجيا، على فريق BellKor's Pragmatic Chaos، لكن الحساب النهائي وضع الفريقين في تعادل إحصائي: حقق كل منهما تحسنًا بنسبة 10.06 بالمائة. على الخوارزمية الأصلية. وفقا لقواعد المسابقة، في حالة التعادل، سيتم منح الجائزة للفريق الذي قدم حله في وقت سابق. في نهاية ثلاث سنوات من النضال، وفي الساعة الأخيرة من المعركة، قدم فريق BellKor's Pragmatic Chaos حله قبل عشرين دقيقة من The Ensemble. تأخير عشرين دقيقة فقط في مسابقة استمرت ثلاث سنوات أدى إلى خسارة جائزة قدرها مليون دولار.

المباراة المثالية

يُطلق على نوع التعلم الحسابي المستخدم في مسابقة تصنيف الأفلام اسم "التعلم الخاضع للإشراف". يستخدم هذا النوع أيضًا في مهام مثل التشخيص الطبي. على سبيل المثال، يمكننا تغذية الكمبيوتر بآلاف صور خلايا الدم البيضاء من الملفات الطبية للمرضى، مع الإشارة إلى معلومات لكل صورة ما إذا كانت الخلايا التي تظهر فيها سرطانية أم لا. ستتعلم الخوارزمية، من هذه المعلومات، تحديد الخلايا الخبيثة باستخدام خصائص معينة للخلية - مثل الشكل والحجم والظل. في هذه الحالة، يقوم الباحثون "بتوجيه" عملية التعلم وإعطاء الكمبيوتر الإجابة الصحيحة لكل صورة في بيانات التدريب.

التعلم الخاضع للإشراف هو النوع الأكثر شيوعًا للتعلم الآلي، ولكنه ليس النوع الوحيد. على سبيل المثال، لا يعرف علماء الروبوتات بالضرورة أفضل طريقة لجعل الروبوت يمشي على قدمين. وفي هذه الحالة، يمكنهم تصميم خوارزمية تقوم بتجربة مجموعة متنوعة من أشكال المشي المختلفة. إذا تسببت مشية معينة في سقوط الروبوت، فستتعلم الخوارزمية عدم استخدامه مرة أخرى.

هذا هو نهج "التعلم المعزز". إنها مبنية على التجربة والخطأ، وهي استراتيجية تعلم مألوفة لدينا جميعًا. في سيناريو التعلم المعزز النموذجي، سواء كان إنسانًا أو آلة، نكون في موقف يتطلب بعض الإجراءات. بدلاً من أن يخبرنا شخص ما بما يجب أن نفعله، فإننا نجرب شيئًا ما ونرى ما سيحدث. وعلى أساس النتيجة نعزز الأفعال الجيدة ونتجنب الأفعال الضارة في المستقبل. وفي النهاية، نتعلم نحن والآلات الإجراءات المناسبة للمواقف المختلفة.

خذ على سبيل المثال محركات البحث على الإنترنت. لم يقم مؤسسو Google بتصفح الويب بالكامل عام 1997 لتدريب أجهزة الكمبيوتر الخاصة بهم على التعرف على الصفحات التي تتناول، على سبيل المثال، "النعجة دوللي". وبدلاً من ذلك، قامت خوارزمياتهم بالزحف إلى الويب وإنشاء مسودة أولية للنتائج، وبعد ذلك اعتمدوا على بيانات نقرات المستخدم لترتيب الصفحات المختلفة وفقًا لأهميتها. عندما ينقر المستخدم على رابط لصفحة في نتائج البحث، تعلم خوارزمية التعلم الآلي أن هذا الرابط ذو صلة. إذا تجاهل المستخدمون رابطًا ظهر في أعلى نتائج البحث، فقد خلصت الخوارزمية إلى أن هذه الصفحة ليست ذات صلة. تتضمن الخوارزمية تعليقات من ملايين المستخدمين لضبط تقييم الصفحات في عمليات البحث المستقبلية.

مشاكل المعلومات الزائدة عن الحاجة

غالبًا ما يستخدم الباحثون التعلم المعزز في المهام التي تتطلب سلسلة من الإجراءات، مثل الألعاب. وتعد لعبة "X-Circle" مثالًا بسيطًا على ذلك. يمكن للكمبيوتر أن يبدأ اللعب عن طريق وضع علامة X في الزاوية بشكل عشوائي. هذه فتحة قوية، وإذا فتح الكمبيوتر معها، فسوف يفوز أكثر مما لو وضع علامة X على الجانب. تم تعزيز الإجراء الذي أدى إلى النصر - وضع علامة X في الزاوية. يواصل الباحثون هذه العملية لاستنتاج الإجراء المناسب في كل مرحلة مستقبلية من اللعبة، ولكل لعبة، بدءًا من لعبة الداما وحتى الرخ. يُستخدم التعلم المعزز أيضًا في التطبيقات الاقتصادية المتقدمة، على سبيل المثال للعثور على توازن ناش.

في بعض الأحيان، حتى التعلم المعزز ليس عمليًا، لأنه في بعض الحالات لا يمكننا الحصول على تعليقات على أفعالنا. في مثل هذه المواقف يجب علينا التحول إلى "التعلم غير الموجه". هنا يمتلك الباحث مجموعة من البيانات، لكن ليس لديه معلومات تملي الإجراء الذي يجب اتخاذه، لا بشكل صريح كما في التعلم الموجه، ولا بشكل غير مباشر كما في التعلم المعزز. إذا كان الأمر كذلك، كيف يمكنك أن تتعلم شيئا من البيانات؟ الخطوة الأولى لاستخراج المعنى منها هي تصنيف البيانات إلى مجموعات بناءً على أوجه التشابه بينها. وتسمى هذه العملية التجميع. تقوم العملية بجمع بيانات غير مصنفة، والتي لا توجد معلومات إضافية عنها، وتستنتج معلومات حول بنيتها الداخلية. يوفر لنا التجميع فهمًا أفضل للبيانات قبل أن نفكر في الإجراء الذي يجب اتخاذه. في بعض الأحيان يكون التقسيم بحد ذاته كافياً. على سبيل المثال، إذا كنا ننظم مكتبة، فإن تصنيف الكتب وفقًا لفئات مماثلة هو كل ما نحتاجه. وفي حالات أخرى يمكننا مواصلة العملية وتطبيق التعلم الموجه على مجموعات البيانات.

ومن المفارقات أن أكبر فخ يقع فيه الأشخاص الذين يتعلمون الآلة هو استخدام الكثير من القوة الحاسوبية لحل مشكلة ما. الفرق بين الهواة والمحترفين هو القدرة على التعرف على هذا الخطأ والتعامل معه بشكل صحيح.

كيف يمكن أن تكون إضافة القوة ضارة؟ تحاول خوارزميات التعلم الآلي العثور على أنماط في البيانات. إذا كانت الخوارزمية قوية للغاية - على سبيل المثال، تستخدم نموذجًا معقدًا للغاية بالنسبة لعينة محدودة - فقد تخدع نفسها و"تكتشف" أنماطًا عشوائية تنتج عن مصادفات في العينة، ولا تعكس علاقات حقيقية. يركز جزء كبير من البحث في النظرية الرياضية للتعلم الحسابي على مشكلة "التناسب الزائد" للبيانات. نريد اكتشاف علاقات حقيقية تطابق البيانات، وليس المبالغة والحصول على أنماط لا يمكن الوثوق بها.

الائتمان: http://work.caltech.edu/telecourse.html

لفهم كيف يمكن أن يحدث ذلك، تخيل رهانًا على طاولة الروليت (للتبسيط، دعنا نقول أنه يحتوي على أرقام حمراء وسوداء فقط، وليس 0 أو 00). يلاحظ المراهن عشر نتائج متتالية، بالتناوب بين الأحمر والأسود. وتعتقد أن "لعبة الروليت يجب أن تكون مزورة، وتكون النتائج دائمًا أحمر-أسود-أحمر-أسود". إنها تخلق نموذجًا في ذهنها تؤكده مجموعة البيانات المحدودة. لكن في الجولة الحادية عشرة، وبعد أن راهنت بمئة دولار على «الأحمر»، برزت طبيعة الروليت العشوائية وعادت وتتوقف الكرة، للمرة الثانية على التوالي، على الأسود ويخسر الرهان.

كانت تبحث عن نمط حيث لم يكن هناك شيء. إحصائيًا، تبلغ فرصة حدوث تسلسل من عشر نقاط توقف بالتناوب بين اللونين الأحمر والأسود حوالي واحد في 500. النتائج السابقة ليس لها أي تأثير على الروليت. فرصة الحصول على اللون الأحمر في الجولة التالية تكون دائمًا 50%. هناك مقولة مشهورة في مجال التعلم الآلي: إذا أجبت على البيانات لفترة كافية، فسوف تعترف بأي شيء.

لتجنب هذه المشكلة، تنحاز خوارزميات التعلم الآلي لإبقاء النماذج بسيطة قدر الإمكان، وذلك باستخدام تقنية تعرف باسم التنظيم. كلما كان النموذج أكثر تعقيدًا، كلما كان أكثر عرضة للتركيب الزائد والتنظيم مما يساعد في الحفاظ على مستوى معقول من التعقيد.

عادة، يقوم الباحثون بالتحقق من صحة الخوارزمية باستخدام البيانات غير المدرجة في بيانات التدريب. وبهذه الطريقة يمكن التأكد من أن الأداء الذي تم الحصول عليه هو أداء حقيقي وليس نتيجة خاطئة لبيانات التدريب. ففي مسابقة Netflix، على سبيل المثال، لم يتم التحكيم بناءً على البيانات المقدمة للمشاركين، بل بناءً على مجموعة بيانات جديدة لا يعرفها إلا العاملون في Netflix.

للتنبؤ بالمستقبل

أولئك الذين يشاركون في التعلم الحسابي ليس لديهم لحظة واحدة من الملل. لن تعرف أبدًا التطبيق الذي ستعمل عليه بعد ذلك. يتيح التعلم الآلي للأشخاص الذين ليس لديهم خبرة في مجال معين (على سبيل المثال، علماء الكمبيوتر في مجال الأزياء) العثور على الارتباطات والتنبؤ بالأداء بناءً على البيانات وحدها. ونتيجة لذلك، هناك اهتمام كبير بهذا المجال. في ربيع عام 2012، اجتذبت دورة التعلم الآلي التي أقوم بتدريسها في معهد كاليفورنيا للتكنولوجيا طلابًا من 15 مجالًا مختلفًا. ولأول مرة، قمت أيضًا بنشر مواد الدورة عبر الإنترنت وبث المحاضرات مباشرة. شاهدهم الآلاف من الأشخاص من جميع أنحاء العالم وأكملوا المهام (يمكنك أيضًا: انظر الرابط أدناه).

ومع ذلك، فإن التعلم الآلي مناسب فقط للمشكلات التي تتوفر عنها بيانات كافية. عندما يُعرض عليّ مشروع محتمل للتعلم الآلي، يكون سؤالي الأول بسيطًا: ما هي البيانات التي لديك؟ لا يقوم التعلم الآلي بإنشاء معلومات ولكنه يستخرجها من البيانات. إذا لم تكن هناك بيانات تدريب كافية تحتوي على المعلومات الضرورية، فلن ينجح التعلم الآلي.

ومع ذلك، يتم تجميع المزيد والمزيد من البيانات في مجالات لا تعد ولا تحصى، وستستمر قيمة التعلم الآلي في النمو. ثق بي - التنبؤات هي تخصصي.

__________________________________________________________________________________________________

عن المؤلف

ياسر س. أبو مططفة هو أستاذ الهندسة الإلكترونية وعلوم الكمبيوتر في معهد كاليفورنيا للتكنولوجيا.

والمزيد حول هذا الموضوع

الآلات التي تتعلم من التلميحات. ياسر س. أبو مصطفى في العلمي الأميركي، المجلد. 272، لا. 4، الصفحات 64-69؛ أبريل 1995.

أوصي بفيلم واربح مليون دولار. جوزيف سيل في علم الهندسة، المجلد. 73، لا. 2، الصفحات 32-39؛ ربيع 2010.

التعلم من البيانات. ياسر س. أبو مصطفى، مالك مجدون إسماعيل، وهسوان تيان لين. كتاب مكافحة غسل الأموال، 2012. http://amlbook.com

التعلم من البيانات (دورة عبر الإنترنت): http://work.caltech.edu/telecourse.html

إضافة إلى التغريد انشر على الفيسبوك فيسبوك

تعليقات 2

  1. كانت أنظمة التعلم الأولى عبارة عن أنظمة التحكم في الحرائق، حيث "خمن" الكمبيوتر البيانات التي قد تؤدي إلى الاصطدام، وتلقى تعليقات بشأن مسافة الاصطدام من الهدف. لقد تعلم من كل ضربة ناجحة.

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.