تسمح الخوارزميات الجديدة للنماذج اللغوية الكبيرة والصغيرة "بالتحدث مع بعضها البعض"، وتوحيد القوى، وتقليل العبء الحسابي - وهي الآن متاحة لملايين المطورين في جميع أنحاء العالم.
كما هو الحال مع البشر من جنسيات مختلفة، تتحدث نماذج الذكاء الاصطناعي أيضًا لغات رقمية مختلفة: كل نموذج يبني لغته الفريدة - كنزًا من الرموز التي يفهمها هو وحده. حتى وقت قريب، لم يكن هناك برنامج ترجمة يسمح لنماذج من شركات مختلفة بالتواصل المباشر، وتوحيد جهودها، وتسريع الأداء. هذا الأسبوع، فيالمؤتمر الدولي حول التعلم الآلي (ICML) في فانكوفر، كندا، علماء من معهد وايزمان للعلوم وفريق من الباحثين منمختبرات إنتل (مختبرات إنتل) خوارزميات رائدة حققت الخوارزميات الجديدة زيادة في الأداء بمعدل 1.5x لنماذج اللغة الكبيرة (LLMs) - النماذج الرائدة في مجال الذكاء الاصطناعي الإبداعي اليوم - وهي متاحة بالفعل لملايين المطورين في جميع أنحاء العالم.
تُعد نماذج اللغة الكبيرة مثل ChatGPT أو Gemini أداة قوية، إلا أنها تعاني من "نقطة ضعف" كبيرة: فهي بطيئة وتستهلك الكثير من الموارد. في عام 2022، أدركت شركات التكنولوجيا العملاقة أنه، تمامًا مثل البشر، يمكن لنماذج الذكاء الاصطناعي الاستفادة من التعاون وتقسيم العمل. وهكذا، وُلدت طريقة تحسين تُسمى فك التشفير التخميني، حيث يقوم نموذج لغوي صغير وسريع، ولكن بقاعدة معرفية محدودة، بتخمين الإجابة الصحيحة لسؤال المستخدم أولاً، ثم يقوم نموذج كبير وبطيء بمراجعتها وتصحيحها. وقد تبنت شركات التكنولوجيا العملاقة فك التشفير التخميني بسرعة نظرًا لميزته الواضحة - فبينما توفر مجموعة متنوعة من الطرق الأخرى تسريعًا، فإنها تميل إلى المساس بجودة النتائج؛ مع فك التشفير التخميني، يتم الحفاظ على الجودة عند 100٪. ومع ذلك، حتى الآن، لا تعمل هذه الطريقة إلا إذا تحدث كلا النموذجين - الكبير والصغير - نفس اللغة الرقمية تمامًا ولم يكن من الممكن الجمع بين نماذج من شركات مختلفة.
"بينما اعتمدت الشركات الكبرى فك التشفير المضاربي وتمتعت بأداء سريع ومليارات الدولارات من المدخرات كل عام في تكاليف طاقة المعالجة، واجهت شركات أخرى صعوبة في الاستفادة من هذه الطريقة، حيث كانت الشركات العملاقة فقط هي التي لديها القدرة على الوصول إلى نموذج صغير وسريع يتحدث نفس لغة النماذج الكبيرة"، كما يوضح ناداف تيمور، طالب الدكتوراه في جامعة ستانفورد. ديفيد هاريل في قسم علوم الحاسوب والرياضيات التطبيقية بمعهد وايزمان، والذي قاد هذا التطوير الجديد. "على الشركات الناشئة التي ترغب في الاستفادة من تسريع أداء فك التشفير التخميني أن تُدرّب نموذجًا صغيرًا بنفسها - وهي مهمة معقدة تتطلب خبرةً واستثمارًا في موارد حاسوبية باهظة الثمن."
"هذا ليس مجرد تحسين نظري؛ بل إنها أدوات عملية تساعد المطورين بالفعل على بناء تطبيقات أسرع وأكثر ذكاءً اليوم"
تتيح الخوارزميات الجديدة التي طورها علماء المعهد وباحثو مختبرات إنتل للمطورين حول العالم اختيار أي نموذج صغير أو كبير والعمل معًا. وللتغلب على حاجز اللغة، ابتكر الباحثون حلين. الأول هو خوارزمية تسمح لنموذج لغوي كبير، أكمل عملية "تفكير"، بترجمة النتائج التي توصل إليها بلغته الفريدة إلى لغة مفهومة لجميع النماذج. أما الثاني فهو خوارزمية تجعل هذه النماذج - الصغيرة والكبيرة - تستخدم في عملها المشترك بشكل رئيسي رموزًا متشابهة - أي علامات تحمل المعنى نفسه في لغات مختلفة، مثل "موز" أو "إنترنت" في اللغات البشرية.
في البداية، كنا قلقين من ضياع قدر كبير من المعلومات أثناء الترجمة، ومن صعوبة عمل النماذج المختلفة معًا، لكن ثبت خطأ هذه المخاوف، كما يوضح تيمور. "حققت الخوارزميات تسارعًا أقصى قدره 2.8x في أداء نماذج اللغات الكبيرة، وبالتالي، من منظور عام للقطاع، فإنها تُؤدي إلى وفورات هائلة في تكاليف طاقة المعالجة."
حظي البحث الجديد بشرف غير معتاد باختياره لعرضه أمام جمهور في مؤتمر ICML، وهو امتيازٌ مُنح لـ 1% فقط من بين حوالي 15,000 مجموعة بحثية قدّمت طلباتها. يقول أورين بيريج، الباحث الأول في مختبرات إنتل وأحد مؤلفي الورقة البحثية: "لقد حلّنا مشكلةً جوهريةً أعاقت مرونة وكفاءة أنظمة الذكاء الاصطناعي الإبداعية". ويضيف: "هذا ليس مجرد تحسين نظري؛ بل أدوات عملية تُساعد المطورين بالفعل على بناء تطبيقات أسرع وأذكى اليوم". في الأشهر الأخيرة، ساهم الباحثون بالخوارزميات التي طوّروها في منصة Hugging Face مفتوحة المصدر، ويستخدمها الآن ملايين المطورين، وأصبحت ممارسةً مقبولةً عند تشغيل الذكاء الاصطناعي.
يُشير تيمور إلى أن "هذا التطور الجديد ذو أهمية خاصة للأجهزة الطرفية الذكية، من الهواتف المحمولة إلى السيارات ذاتية القيادة والطائرات بدون طيار، فعندما لا تكون هذه الأجهزة متصلة بالإنترنت، فإنها تُضطر للعمل في ظل ظروف ذات قدرة حوسبة محدودة". ويضيف: "تخيل سيارة ذاتية القيادة تعتمد على الذكاء الاصطناعي للقيادة الآمنة - في هذه الحالة، قد يكون تبسيط وتسريع الأداء هو الفرق بين اتخاذ القرار الصحيح في الوقت المناسب وارتكاب خطأ فادح".
وشارك في الدراسة أيضًا الدكتور جوناثان مامو، ودانيال كوريت، وموشيه بارشانسكي، وموشيه فيسربالت من مختبرات إنتل، وجوراو جاين من شركة دي-ماتريكس.
المزيد عن الموضوع على موقع العلوم: