تغطية شاملة

آلات التعلم

بعد عقود من خيبة الأمل، بدأ الذكاء الاصطناعي أخيرًا في تحقيق الرؤية الموعودة في البداية، وذلك بفضل تقنية قوية تسمى التعلم العميق.

الذكاء الاصطناعي. المصدر: ويكيميديا ​​/ جينجيسكانهج.
الذكاء الاصطناعي. مصدر: ويكيميديا ​​/ جينجيسكانهج.

من جوشوا بنجيوتم نشر المقال بموافقة مجلة Scientific American Israel وشبكة Ort Israel 11.08.2016

  • أصبح الذكاء الاصطناعي مجالًا جديًا للبحث في منتصف الخمسينيات. وكان الباحثون آنذاك يتوقعون الوصول إلى مستوى الذكاء البشري خلال فترة زمنية من الحياة الأكاديمية.
  • تبددت هذه الآمال عندما أصبح من الواضح أن الخوارزميات وقوة الحوسبة في ذلك الوقت لم تكن ببساطة على مستوى المهمة. حتى أن بعض المتشككين ذكروا أن المجال بأكمله ليس أكثر من مجرد غرور لا أساس له من الصحة.
  • لقد عاد هذا المجال إلى الحياة في السنوات الأخيرة، مع تصميم برمجيات بطريقة مشابهة للشبكات العصبية في الدماغ، مما يدل على أن الوعد القديم للذكاء الاصطناعي قد يتحقق بعد كل شيء.
  • يمكن للتعلم العميق - وهو أسلوب يستخدم شبكات عصبية معقدة - أن يتعلم مفاهيم مجردة، ويصل بالفعل اليوم إلى أداء يعادل أداء البشر في مهام معينة.

في الخمسينيات من القرن العشرين، بدأت أجهزة الكمبيوتر تتفوق على البشر في لعبة الداما وتثبت النظريات الرياضية، مما أثار حماسًا كبيرًا. في ستينيات القرن العشرين، تزايد الأمل في أن يتمكن العلماء قريبًا من تقليد الدماغ البشري في الأجهزة والبرمجيات، وأن "الذكاء الاصطناعي" (AI) سيكون قادرًا على التعامل مع أي مهمة على نفس مستوى البشر. في عام 50، أعلن مارفن مينسكي من معهد ماساتشوستس للتكنولوجيا (الذي وافته المنية في يناير 60) أن التحدي المتمثل في الذكاء الاصطناعي سيتم حله في غضون جيل واحد.

وكان هذا التفاؤل، بطبيعة الحال، سابقا لعصره. فالبرامج المكتوبة لمساعدة الأطباء في تشخيص الأمراض، وشبكات الكمبيوتر المستوحاة من الدماغ البشري للتعرف على محتوى الصور، لم ترقى إلى مستوى التوقعات. في تلك السنوات الأولى، كانت الخوارزميات بسيطة جدًا، وكانت بحاجة إلى معلومات أكثر مما كان متاحًا في ذلك الوقت. وكانت قوة المعالجة لأجهزة الكمبيوتر أيضًا متواضعة جدًا بحيث لم تتمكن من دعم الحسابات الثقيلة المطلوبة لإنشاء أي شيء يقترب من تعقيد الفكر البشري.

في منتصف العقد الأول من القرن الحادي والعشرين، اختفى تقريبًا حلم الآلات ذات الذكاء البشري من المجتمع العلمي. ويبدو أن مصطلح الذكاء الاصطناعي نفسه ترك مجالات العلوم الجادة. وصف العلماء والكتاب الآمال المحطمة في الفترة ما بين السبعينيات ومنتصف العقد الأول من القرن الحادي والعشرين بأنها "شتاء الذكاء الاصطناعي".

ولكن في عقد واحد فقط تغير كل شيء. ابتداءً من عام 2005، تغيرت النظرة المستقبلية للذكاء الاصطناعي من البداية إلى النهاية. حدث ذلك عندماالتعلم العميق"، وهو نهج لبناء آلات ذكية مستوحى من علم الأعصاب، بدأ يقف على قدميه. في السنوات الأخيرة، أصبح التعلم العميق قوة هائلة وفريدة من نوعها تدفع الأبحاث في مجال الذكاء الاصطناعي، وتستثمر الشركات الرائدة في مجال تكنولوجيا المعلومات مليارات الدولارات في تطويره.

يصف مصطلح التعلم العميق تصور الشبكات العصبية التي "تتعلم" تدريجيًا كيفية التعرف على الصور وفهم الكلام وحتى اتخاذ القرارات بنفسها. تعتمد هذه التقنية على الشبكات العصبية الاصطناعية - مكون أساسي للبحث اليوم في مجال الذكاء الاصطناعي. لا تقلد الشبكات العصبية الاصطناعية بدقة طريقة عمل الخلايا العصبية البيولوجية (الخلايا العصبية)، ولكنها تعتمد على مبادئ رياضية عامة تسمح لها بالتعلم، من خلال الأمثلة، كيفية التعرف على الأشخاص أو الأشياء في الصور، أو الترجمة بين أكثر الصور شيوعًا في العالم. اللغات.

أحدثت تكنولوجيا التعلم العميق ثورة في أبحاث الذكاء الاصطناعي وأحيت الآمال القديمة في رؤية الكمبيوتر وفهم الكلام ومعالجة اللغة الطبيعية والروبوتات. ظهرت أولى منتجاتها في مجال فهم الكلام في عام 2012 في أحد مكونات نظام بحث جوجل المسمى جوجل الآن. وبعد فترة وجيزة، ظهرت تطبيقات للتعرف على محتوى الصور، وهي ميزة مدمجة الآن في محرك البحث الخاص بـ صور Google.

أي شخص يعاني من الإحباط من استخدام قوائم الهاتف الآلية القديمة سوف يقدر الفوائد الهائلة للمساعد الشخصي المحسن للهواتف الذكية. أولئك منا الذين يتذكرون مدى ضعف التعرف على الأشياء في الصور قبل بضع سنوات فقط، عندما حددت البرامج عن طريق الخطأ، على سبيل المثال، الكائنات غير الحية على أنها حيوانات، يرون مدى مذهلة التقدم في رؤية الكمبيوتر: اليوم هناك أجهزة كمبيوتر قادرة على في ظل ظروف معينة، يمكن التعرف على قطة أو حجر أو شخص في الصورة بنفس القدر الذي يحققه المراقب البشري. في الواقع، أصبحت برامج الذكاء الاصطناعي جزءًا من الحياة اليومية لملايين مستخدمي الهواتف الذكية. أنا شخصياً بالكاد أكتب المزيد من الرسائل - عادةً ما أتحدث فقط على الهاتف، وفي بعض الأحيان يجيبني أيضًا.

وقد فتحت هذه المزايا فجأة الباب أمام المزيد من الاستغلال التجاري لهذه التكنولوجيا، والإثارة آخذة في الازدياد. تتنافس الشركات مع بعضها البعض بحماس على الموظفين الموهوبين، وتعد شهادات الدكتوراه في التخصص في التعلم العميق سلعة نادرة يكثر عليها الطلب. العديد من الأساتذة المتخصصين في هذا المجال، ويدعي البعض أن معظمهم، تم سحبهم من المجال الأكاديمي إلى الصناعة، وحصلوا على تسهيلات بحثية وحوافز مالية سخية.

أدى العمل على تحديات التعلم العميق إلى نجاحات مذهلة. كشبكة عصبية فاز لاعب جوجو الرائد في العالم, لي سي دول، هذا تصدرت العناوين الرئيسية. هناك بالفعل تطبيقات تستفيد من مجالات أخرى من الخبرة البشرية، وليس فقط الألعاب. لقد طوروا مؤخرًا خوارزمية للتعلم العميق يمكنها تشخيص قصور القلب استنادًا إلى التصوير بالرنين المغناطيسي (MRI)، بنفس مستوى الدقة الذي يتمتع به طبيب القلب.

الذكاء والمعرفة والتعلم

لماذا واجه الذكاء الاصطناعي الكثير من العقبات في العقود الماضية؟ والسبب هو أن معظم معرفتنا بالعالم من حولنا ليست مبنية على لغة مكتوبة، كمجموعة من المهام الواضحة، كما هو مطلوب لإنشاء برنامج كمبيوتر من أي نوع. ولهذا السبب لم نتمكن من برمجة جهاز كمبيوتر للقيام، بشكل مباشر، بالعديد من الأشياء التي نقوم بها نحن البشر بسهولة، مثل فهم الكلام والصور واللغة، أو قيادة السيارة. إن المحاولات الرامية إلى تنظيم مجموعات من الحقائق في قواعد بيانات معقدة، لإعطاء الكمبيوتر مظهر الذكاء، لم تحقق سوى نجاح ضئيل.

وهنا يأتي دور التعلم العميق. إنه جزء من مجال أكبر يسمى "التعلم الآلي" ويعتمد على مبادئ تدريب أنظمة الكمبيوتر الذكية إلى المستوى الذي تكون فيه الأنظمة قادرة على تعليم نفسها. يتضمن أحد هذه المبادئ ما يعتبره الشخص أو الآلة قرارًا "جيدًا". في الحيوانات، تملي عمليات التطور اتخاذ قرارات تؤدي إلى شكل من أشكال السلوك الذي يحسن فرص البقاء والتكاثر. في المجتمعات البشرية، قد يتضمن القرار الجيد تفاعلات اجتماعية تعزز الوضع الاجتماعي للفرد أو الشعور بالرفاهية الشخصية. ومن ناحية أخرى، بالنسبة للآلات، مثل السيارة ذاتية القيادة، يتم قياس جودة القرارات بمدى مطابقتها لقرارات السائقين البشريين الأكفاء.

في سياقات محددة، ليس من الواضح دائمًا كيفية ترجمة المعرفة اللازمة لاتخاذ قرار جيد إلى كود برمجي. فالفأر، على سبيل المثال، يعرف ما يحيط به، ولديه قدرة فطرية على الشم في المكان الصحيح، وتحريك أرجله، والعثور على الطعام أو الرفقاء، وتجنب الحيوانات المفترسة. لن يتمكن أي مبرمج من إنشاء سلسلة من التعليمات المتسلسلة التي ستنتج هذه السلوكيات خطوة بخطوة. ومع ذلك، فإن المعرفة تكمن بطريقة ما في عقل القارض.

قبل أن يتمكنوا من إنشاء أجهزة كمبيوتر قادرة على تدريب أنفسهم، كان على علماء الكمبيوتر الإجابة على أسئلة أساسية، مثل "كيف يكتسب البشر المعرفة؟" بعض معرفتنا فطرية، ولكن معظمها يأتي من الخبرة. إن الأشياء التي نعرفها بشكل حدسي لا يمكن تحويلها إلى تسلسل واضح من الخطوات التي يمكن للكمبيوتر تشغيلها، ولكن يمكن تعلمها في كثير من الأحيان من خلال الأمثلة والممارسة. منذ خمسينيات القرن العشرين، بحث الباحثون وحاولوا صياغة مبادئ عامة بدقة تسمح للحيوانات والبشر، وحتى الآلات، باكتساب المعرفة من خلال الخبرة. الغرض من التعلم الآلي هو إنشاء عمليات - خوارزميات التعلم - التي تسمح للآلة بالتعلم من الأمثلة المقدمة لها.

إن علم التعلم الآلي هو علم تجريبي في الأساس، لأنه لا توجد خوارزمية تعلم عالمية من شأنها أن تسمح للكمبيوتر بالتعلم الجيد لأي مهمة من أي نوع. تحتاج كل خوارزمية لاكتساب المعرفة إلى فحصها من خلال مهام وبيانات محددة لعالم محتوى معين، وأحدها ما إذا كان تحديد غروب الشمس في صورة أو ترجمة من الإنجليزية إلى اللغة الأردية. لا توجد طريقة لإثبات أن خوارزمية معينة ستكون أفضل من جميع الخوارزميات الأخرى في أي موقف.

وقام باحثو الذكاء الاصطناعي بصياغة وصف رياضي رسمي لهذا المبدأ - وهي نظرية تعرف باسم: "لا توجد وجبات مجانية" - والتي توضح أنه لا توجد خوارزمية قادرة على التعامل مع كل موقف تعليمي في العالم الحقيقي. ومع ذلك، يبدو أن السلوك البشري يدحض هذه النظرية. ظاهريًا، على الأقل، لدينا قدرات تعليمية عامة إلى حد ما في أذهاننا، والتي تسمح لنا بأداء مجموعة واسعة من المهام التي لم يدرب التطور أسلافنا على أدائها، مثل لعب الشطرنج، أو بناء الجسور، أو البحث في الذكاء الاصطناعي.

تشير هذه القدرات إلى أن الذكاء البشري يستفيد من الفرضيات العامة حول العالم، وقد تلهم هذه الفرضيات إنشاء آلات ذات ذكاء عام مماثل. ولهذا السبب بالذات، اعتمد الباحثون الذين يقومون بتطوير الشبكات العصبية الاصطناعية الدماغ كنموذج أولي لتصميم الأنظمة الذكية.

وحدات الحوسبة الرئيسية في الدماغ هي الخلايا العصبية التي تسمى الخلايا العصبية. ترسل كل خلية عصبية إشارات إلى الخلايا العصبية الأخرى عبر مساحات صغيرة بين الخلايا، تسمى الفجوات المشبكية. يُطلق على ميل خلية عصبية معينة لإرسال إشارة خلال هذه الفترة، وقوة الإشارة التي ترسلها، اسم "قوة متشابك". عندما "تتعلم" الخلية العصبية، تزداد قوة التشابك العصبي، وبالتالي، عندما تتلقى تحفيزًا كهربائيًا، تزداد فرص إرسال الإشارات إلى جيرانها.

لقد أثر البحث في علم الأعصاب على إنشاء شبكات عصبية اصطناعية، والتي تحاكي نشاط الخلايا العصبية من خلال البرامج أو الأجهزة. أطلق الباحثون الأوائل في هذا المجال الفرعي من الذكاء الاصطناعي علىالترابطية"، افترض أن الشبكات العصبية يمكن أن تتعلم أداء المهام المعقدة عن طريق تغيير الروابط بين الخلايا العصبية تدريجيًا. ستؤدي هذه التغييرات إلى أن تمثل أنماط النشاط العصبي في نهاية المطاف محتوى الإدخال، والذي يمكن أن يكون، على سبيل المثال، صورة أو مقطع محادثة. ومع تلقي الشبكات المزيد من العينات، ستستمر عمليات التعلم في تغيير نقاط القوة التشابكية للخلايا العصبية وتحقيق تمثيل أكثر دقة للمدخلات - صور غروب الشمس، على سبيل المثال.

دروس الغروب

يمتد الجيل الحالي من الشبكات العصبية إلى التطورات الرائدة في مجال الاتصالات. تغير الشبكات تدريجيًا القيم العددية لكل اتصال متشابك، وهي القيم التي تمثل قوة الاتصال، وبالتالي احتمال قيام الخلية العصبية بإرسال إشارة إلى خلية عصبية أخرى. تقوم خوارزمية التعلم العميق بتغيير هذه القيم في تغييرات دقيقة في كل مرة "تعرض" الشبكة صورة جديدة. تقترب القيم ببطء وثبات من الموقف حيث ستتمكن الشبكة العصبية من تخمين محتوى الصورة بشكل أفضل.

اليوم، تتطلب خوارزميات التعلم الكثير من المشاركة البشرية لتحقيق النتائج المثلى. تعمل معظم هذه الخوارزميات من خلال التعلم الخاضع للإشراف، حيث يكون كل مثال في مرحلة التدريب مصحوبًا بعلامة من صنع الإنسان تحدد محتوى المثال. على سبيل المثال، صورة غروب الشمس ستكون مصحوبة بتعليق "غروب الشمس الساخن". في هذه الحالة، الهدف من خوارزمية التعلم الخاضع للإشراف هو تلقي صورة كمدخل، وإنتاج الاسم الرئيسي في الصورة كمخرج. تسمى العملية الرياضية لتحويل المدخلات إلى مخرجات "بالدالة". القيم العددية، أو نقاط القوة التشابكية، التي تنشئ هذه الوظيفة هي في الواقع حل لمهمة التعلم.

إن تعلم الإجابات الصحيحة من خلال الحفظ مهمة سهلة، ولكنها لا قيمة لها على الإطلاق. نريد أن نعلم الخوارزمية ما هو غروب الشمس، حتى تتمكن من اكتشاف أي غروب الشمس، في أي صورة، حتى لو لم "تشاهد" الخوارزمية هذه الصورة أثناء التدريب. إن القدرة على اكتشاف بعض الاختلالات - بمعنى آخر، تعميم التعلم بما يتجاوز الأمثلة المحددة - هي الهدف الرئيسي لأي خوارزمية تعلم آلي. في الواقع، يتم قياس جودة التدريب لأي شبكة باستخدام أمثلة لم تشهدها الشبكة من قبل. تعود صعوبة تعميم التعلم على الأمثلة الجديدة بشكل جيد إلى حقيقة أن هناك عددًا لا حصر له تقريبًا من الإصدارات الممكنة التي يمكن أن تناسب أي فئة، على سبيل المثال فئة "غروب الشمس".

"إن العودة العظيمة للذكاء الاصطناعي، بعد سبات طويل، تعلمنا درسا في علم اجتماع العلوم وتؤكد الحاجة إلى تعزيز الأفكار التي تتحدى الوضع التكنولوجي الراهن."

من أجل التعميم بنجاح من خلال النظر إلى الأمثلة، تحتاج خوارزمية التعلم المستخدمة في طريقة التعلم العميق إلى أكثر من الأمثلة نفسها. كما أنها تعتمد على افتراضات حول البيانات، وافتراضات حول ما يعتبر حلاً محتملاً للمشكلة. قد تكون الفرضية النموذجية المضمنة في البرنامج، على سبيل المثال، أنه إذا كانت بيانات الإدخال التي تتلقاها وظيفة معينة هي بيانات مشابهة لبعضها البعض، فيجب ألا يتغير مخرجاتها كثيرًا أيضًا: تغيير بضع وحدات بكسل في صورة قطة، عادة لن تحول القطة إلى كلب.

يُطلق على أحد أنواع الشبكات العصبية التي تجمع بين الفرضيات حول الصور اسم الشبكة العصبية تلافيفيوأصبحت تقنية أساسية في صعود الذكاء الاصطناعي. تشتمل الشبكات العصبية التلافيفية المستخدمة في التعلم العميق على طبقات عديدة من الخلايا العصبية، مرتبة بطريقة تجعل المخرجات أقل حساسية للتغيرات في العظم الرئيسي للصورة - على سبيل المثال، إذا تغير موضعها قليلاً. ستتمكن الشبكة المدربة جيدًا من التعرف على وجه شخص معين حتى لو تمت رؤيته من زوايا مختلفة في صور مختلفة. يستمد هيكل الشبكات التلافيفية الإلهام من البنية متعددة الطبقات للقشرة البصرية، وهو جزء الدماغ الذي يتلقى المدخلات من العيون. إن الطبقات العديدة للخلايا العصبية الافتراضية في الشبكة العصبية التلافيفية هي ما يجعلها "عميقة" وأكثر ملاءمة للتعرف على العالم من حولها.

إلى عمق الأشياء

على المستوى العملي، فإن التطورات التي جعلت التعلم العميق ممكنا نتجت عن بعض الابتكارات التي ظهرت قبل حوالي عشر سنوات، عندما كان الاهتمام بالذكاء الاصطناعي والشبكات العصبية في أدنى مستوياته منذ عقود. منظمة كندية تمولها الحكومة وبمساعدة جهات مانحة من القطاع الخاص، المعهد الكندي للأبحاث المتقدمة (سيفار) اسمه، ساعد في إحياء الاهتمام عندما قام برعاية برنامج بحثي بقيادة جيفري هينتون من جامعة تورنتو. كما شاركوا في البرنامج جان ليكون من جامعة نيويورك، أندرو نج من جامعة ستانفورد، برونو أولشاوزن من جامعة كاليفورنيا في بيركلي، أنا (جوشوا بنجيو)، و اخرين. في تلك الأيام، كان الموقف السلبي تجاه هذا الاتجاه البحثي يجعل من الصعب نشر المقالات، وكان من الصعب حتى إقناع الطلاب بالعمل في هذا المجال. ومع ذلك، كنا مقتنعين بأنه من المهم المضي قدما.

وكانت الشكوك في ذلك الوقت فيما يتعلق بالشبكات العصبية تنبع جزئيًا من الاعتقاد بأن تدريب الشبكات غير مجدٍ، بسبب التحديات التي ينطوي عليها تحسين سلوك الشبكات. التحسين هو فرع من الرياضيات يحاول إيجاد شكل من أشكال تنظيم مجموعة من المعلمات بحيث تحقق هدفًا رياضيًا. وفي حالة الشبكات، فإن هذه المعلمات هي الأوزان التشابكية، وهي تمثل قوة الإشارة التي تنتقل من خلية عصبية إلى أخرى.

الهدف هو إنتاج تنبؤات بأقل عدد من الأخطاء. عندما تكون العلاقة بين المعلمات والهدف علاقة بسيطة - وبشكل أكثر دقة، عندما يكون الهدف وظيفة محدبة من المعلمات - يمكنك ضبط المعلمات تدريجيا. ستستمر عملية الضبط حتى تقترب المعلمات قدر الإمكان من القيم التي تعطي أفضل نتيجة، وهو ما يعرف بالحد الأدنى العالمي. وتعني هذه النتيجة أن متوسط ​​خطأ الشبكة في توقعاتها سيكون أقل ما يمكن.

ومع ذلك، بشكل عام، ليس من السهل تدريب الشبكة العصبية، ويلزم إجراء عملية تسمى التحسين غير المحدب. ويشكل هذا النوع من التحسين تحديًا أكبر بكثير، ويعتقد العديد من الباحثين أنه من المستحيل اللقاء على الإطلاق. قد تتعثر خوارزمية التعلم فيما يسمى بالحد الأدنى المحلي، وبالتالي لن تتمكن من تقليل خطأ التنبؤ عن طريق إجراء تغييرات صغيرة على المعلمات.

تم دحض أسطورة صعوبة تدريب الشبكات العصبية بسبب الحد الأدنى المحلي فقط في عام 2015. اكتشفنا في بحثنا أنه عندما تكون الشبكة كبيرة بدرجة كافية، تقل مشكلة الحد الأدنى المحلي بشكل كبير. في الواقع، تتوافق معظم نقاط الحد الأدنى المحلية مع مستويات معرفة قريبة جدًا من القيمة المثلى للحد الأدنى العالمي.

قد تكون مشكلة التحسين النظرية قابلة للحل، ولكن من الناحية العملية، غالبًا ما تفشل محاولات بناء شبكات تحتوي على أكثر من طبقتين أو ثلاث طبقات. وبدءًا من عام 2005، تمكنت الأبحاث التي يدعمها CIFAR من تحقيق اختراقات تغلبت أيضًا على هذه المشكلات. في عام 2006، تمكنا من تدريب الشبكات العميقة باستخدام تقنية تعمل على تطوير طبقة واحدة في كل مرة.

ثم، في عام 2011، اكتشفنا طريقة أفضل لتدريب شبكات أعمق - أي باستخدام طبقات إضافية من الخلايا العصبية الافتراضية - عن طريق تغيير الحسابات التي تجريها كل وحدة من وحدات المعالجة هذه. وهذا التغيير جعلها تتصرف مثل الخلايا العصبية البيولوجية. ووجدنا أيضًا أن إضافة ضوضاء عشوائية عمدًا إلى الإشارات المنقولة بين الخلايا العصبية أثناء التدريب (مرة أخرى، على غرار ما يحدث في الدماغ) أدى إلى تحسين قدرة الشبكة على تعلم التعرف على الصورة أو الصوت.

هناك عاملان أساسيان ساهما في نجاح تقنيات التعلم العميق. الأول هو زيادة سرعة الحساب بمقدار عشرة أضعاف، وذلك بفضل وحدات معالجة الرسومات المصممة أصلاً لألعاب الفيديو. وبمساعدتهم، كان من الممكن تدريب شبكات أكبر في فترات زمنية معقولة. العامل الثاني الذي عزز التعلم العميق هو توافر مجموعات ضخمة من البيانات المصنفة، والتي بمساعدتها خوارزمية التعلم قادرة على تحديد الإجابات الصحيحة - على سبيل المثال، الإجابة "قطة" عند فحص صورة فيها قطة فقط أحد الأشياء التي تم تصويرها.

سبب آخر للنجاح الأخير للتعلم العميق هو قدرته على تعلم إجراء سلسلة من العمليات الحسابية التي تبني أو تحلل، خطوة بخطوة، صورة أو تسجيل صوتي أو بيانات أخرى. كلما كانت الشبكة أعمق، كلما زاد عدد هذه الخطوات. تتطلب العديد من مهام التعرف المرئي أو الصوتي التي يتفوق فيها الذكاء الاصطناعي اليوم شبكة عميقة ذات طبقات عديدة. وفي الواقع، أظهرنا في الدراسات النظرية والعملية الحديثة أن بعض هذه العمليات الرياضية لا يمكن إجراؤها بكفاءة على الإطلاق دون وجود شبكات عميقة بما فيه الكفاية.

تعالج كل طبقة في الشبكة العصبية العميقة مدخلاتها وتنتج مخرجات يتم إرسالها إلى الطبقة التالية في السطر. كلما كانت الطبقة أعمق، كلما كانت المفاهيم الأكثر تجريدًا التي تمثلها الشبكة، وأكثر بعدًا عن المدخلات الأولية الأولية [انظر الشكل]. أظهرت التجارب أن الخلايا العصبية الاصطناعية في الطبقات العميقة من الشبكة تميل إلى الاتصال بمفاهيم دلالية مجردة، مثل "سطح المكتب". قد يظهر التعرف على المكتب في الصورة نتيجة للمعالجة بواسطة الخلايا العصبية في طبقة عميقة، حتى لو لم يتم تضمين مفهوم "المكتب" في تسميات الفئة التي تم تدريب الشبكة عليها. أيضًا، قد يكون مفهوم الجدول نفسه مجرد خطوة وسيطة نحو إنشاء مفهوم أكثر تجريدًا في طبقة أعمق، والتي قد تصنف الصورة على سبيل المثال على أنها "مكتب".

أبعد من التعرف على الأنماط

حتى الآن، تتميز الشبكات العصبية الاصطناعية بشكل أساسي بقدرتها على التعرف على الأنماط في الصور الثابتة. ومع ذلك، هناك نوع آخر من الشبكات العصبية الذي تأثيره واضح: شبكة عصبية تحلل الأحداث التي تحدث مع مرور الوقت. تسمى هذه الشبكات شبكات "التكرار".، القدرة على إجراء سلسلة من العمليات الحسابية دون أخطاء، عادةً لتحليل الكلام والفيديو والبيانات الأخرى. تتكون البيانات التسلسلية من وحدات، مثل الصوتيات أو الكلمات الكاملة، التي تأتي واحدة تلو الأخرى. تقوم الشبكات المتكررة بمعالجة مثل هذه البيانات بطريقة مشابهة لكيفية عمل الدماغ: الإشارات التي تمر بين الخلايا العصبية تتغير باستمرار بعد معالجة البيانات الجديدة القادمة من الحواس. وتتغير هذه الحالة العصبية الداخلية وفقا للمدخلات التي تصل إلى الدماغ من البيئة، قبل أن يطلق الدماغ سلسلة من الأوامر التي تسبب سلسلة من حركات الجسم المصممة لتحقيق هدف معين.

الشبكات المتكررة قادرة على التنبؤ بما ستكون عليه الكلمة التالية في الجملة، ويمكن استخدام هذه المعلومات لإنشاء تسلسلات جديدة من الكلمات واحدة تلو الأخرى. كما أن الشبكات قادرة على أداء مهام أكثر تعقيدًا: بعد "قراءة" جميع الكلمات الموجودة في الجملة، ستكون الشبكة قادرة على تخمين معنى الجملة بأكملها. يمكن لشبكة متكررة أخرى استخدام المعالجة الدلالية للشبكة الأولى لترجمة الجملة إلى لغة أخرى.

شهدت الأبحاث في مجال الشبكات العصبية المتكررة تأخيرات خاصة بها، بين أواخر التسعينيات وأوائل العقد الأول من القرن الحادي والعشرين. أظهرت دراساتي النظرية أنه سيكون من الصعب على هذه الشبكات أن تتعلم كيفية استرجاع المعلومات من الماضي البعيد، أي العناصر الأولى للتسلسل الذي تمت معالجته: تخيل أنك تحاول قراءة الكلمات بدقة من بداية كتاب انتهيت للتو من قراءته. ومع ذلك، فقد أدت بعض التطورات الأخيرة إلى تقليل هذه المشكلة وسمحت لهذه الشبكات بتعلم كيفية تخزين المعلومات بحيث يتم الحفاظ عليها بمرور الوقت. يمكن للشبكة العصبية استخدام الذاكرة المؤقتة للكمبيوتر لمعالجة أجزاء متعددة ومنفصلة من المعلومات، مثل الأفكار المعبر عنها في جمل مختلفة في المستند.

إن العودة العظيمة للشبكات العصبية العميقة، في نهاية شتاء الذكاء الاصطناعي الطويل، ليست مجرد انتصار تكنولوجي. كما أنه يعلمنا درسا في علم اجتماع العلوم، ويؤكد بشكل خاص على ضرورة دعم الأفكار التي تتحدى الوضع التكنولوجي الراهن، وتشجيع البحوث المتنوعة، والتي يمكن أيضا أن تعزز المجالات التي فقدت بريقها لفترة من الوقت.

هذا المقال جزء من مراجعة خاصة حول الذكاء الاصطناعي تجريها مجلة ساينتفيك أمريكان إسرائيل. أنظر أيضا:

هل هناك ما نخشاه من الروبوتات الأكثر ذكاءً منا؟

الحقيقة حول السيارات بدون سائق

جيد ان تعلم

التعلم الالي: الشبكات الذكية التي تصبح أكثر ذكاءً

وقد ألهمت الاتصالات بين الخلايا العصبية في القشرة الدماغية إنشاء خوارزميات تحاكي هذه الاتصالات المعقدة. من الممكن تدريب شبكة عصبية اصطناعية للتعرف على الوجوه من خلال التعرض لعدد لا يحصى من الصور. وبعد أن "تتعلم" الشبكة كيفية تمييز الوجوه بشكل عام (مقارنة بالأيدي مثلا) ومن ثم التعرف على وجوه محددة، فإنها تستخدم هذه المعرفة للتعرف على الوجوه التي شاهدتها من قبل، حتى لو كانت تظهر في الصورة بشكل مختلف قليلا. الزاوية التي تدرب عليها.

للتعرف على الوجه، تبدأ الشبكة بتحليل وحدات البكسل الفردية للصورة المقدمة لها في طبقة الإدخال الخاصة بها. وفي الطبقة التالية، تختار الأشكال الهندسية التي تميز وجهًا معينًا. تكتشف الطبقات المتوسطة العينين والفم والملامح الأخرى، قبل أن تكتشف الطبقة العليا الوجه ككل. توفر طبقة الإخراج "تخمينًا" - ما إذا كان الوجه ينتمي إلى Yoel أو Kobi أو Lior.

عن الكتاب

جوشوا بنجيو - أستاذ علوم الكمبيوتر في جامعة مونتريال، وأحد رواد تطوير أساليب التعلم العميق، التي أدت إلى إحياء مجال الذكاء الاصطناعي.

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.