تغطية شاملة

سوف يقوم الذكاء الاصطناعي باستعادة النصوص اليهودية القديمة

قرر طلاب السنة الرابعة في قسم هندسة البرمجيات ونظم المعلومات في جامعة بن غوريون في النقب إنتاج إجابة حديثة للكتابات القديمة وبتوجيه من البروفيسور مارك ليست، قاموا بتطوير ذكاء اصطناعي النظام الذي يكمل الأقسام المفقودة في النصوص القديمة

استخدام الذكاء الاصطناعي لفك رموز النصوص القديمة. الصورة من إعداد دالي وهي لأغراض توضيحية فقط ولا ينبغي اعتبارها صورة علمية
استخدام الذكاء الاصطناعي لفك رموز النصوص القديمة. الصورة من إعداد دالي وهي لأغراض توضيحية فقط ولا ينبغي اعتبارها صورة علمية

تعتبر الاكتشافات الأثرية القديمة المتعلقة بالشعب اليهودي مهمة لتعزيز الهوية والارتباط بالثقافة والتاريخ، لكن الكثير منها تمزق أو تلاشت على مر السنين. قام طلاب من قسم هندسة البرمجيات ونظم المعلومات في جامعة بن غوريون في النقب بتطوير نظام ذكاء اصطناعي ينجح في إكمال الأقسام المفقودة، بما في ذلك الأحرف المفردة، الكلمات الكاملة أو أجزاء من الكلمات، كجزء من مشروعهم النهائي. المشروع كانت مقدمة عُقد مؤخرًا في مؤتمر أوروبا الوسطى للغويات الحاسوبية (EACL 2024) الذي انعقد في جزيرة مالطا. 

تعتبر النقوش بالعبرية والآرامية مصدرًا أساسيًا للمعلومات حول التاريخ القديم للشرق الأدنى. ولسوء الحظ، أصبحت بعض أجزاء النصوص غير مقروءة مع مرور الوقت. يستخدم خبراء خاصون، يطلق عليهم علماء النقوش (فك رموز النقوش)، إجراءات يدوية لتقييم المحتوى المفقود، لكن هذا الإجراء يستغرق وقتًا طويلاً وفي كثير من الحالات لا يوصل الباحثين إلى استنتاجات لا لبس فيها.

نيف بونو، هاريل موشيوف، إلدر كارول، وإيتي أشرف، قرر طلاب السنة الرابعة في قسم هندسة البرمجيات ونظم المعلومات في جامعة بن غوريون في النقب إنتاج رد حديث على الكتابات القديمة وبتوجيه من البروفيسور مارك ليستطور نظام ذكاء اصطناعي يكمل الأقسام المفقودة في النصوص القديمة.

وتعد هذه الدراسة الأولى من نوعها التي تطبق نظام الذكاء الاصطناعي لاستكمال النقوش التالفة باللغتين العبرية والآرامية القديمة، وذلك باستخدام حروف الأبجدية العبرية التي تتكون بشكل رئيسي من الحروف الساكنة. ويجمع نموذج "المجموعة" الذي قاموا بتطويره بين عدد من النماذج المدربة على آيات الكتاب المقدس باللغتين العبرية والآرامية، على افتراض أن لغة الكتاب المقدس (بدون علامات الترقيم) أقرب إلى لغة الكتابات القديمة مقارنة باللغة العبرية الحديثة . حتى الآن، تم تنفيذ عدد من النماذج التي تنبأت بالكلمات الكاملة بشكل جيد، ولكن التنبؤ بأجزاء الكلمة أو الأحرف المفقودة كان أقل جودة. 

تقديم نموذج "الفرقة". الائتمان: الشيخ كارول

اعتمد أسلوب البحث على 1,071 آية مختارة عشوائياً من الكتاب المقدس (536 للاختبار و536 للتحقق كمجموعة ضابطة). تم استخدام الآيات الـ 22,144 المتبقية من الكتاب المقدس لضبط معايير النماذج التي تم تدريبها مسبقًا على قواعد بيانات النصوص العبرية الحديثة لتتوافق مع النصوص العبرية القديمة. يقوم المستخدم بإدخال نص في النظام يتضمن الأجزاء المفقودة، وبالنسبة للأجزاء المفقودة، سيعرض النظام عدة خيارات، بما في ذلك احتمال كل إكمال ممكن - كلمة واحدة، حرف أو كلمة جزئية.

رابط لصورة المجموعة البحثية. من اليمين إلى اليسار: البروفيسور مارك ليست، الشيخ كارول، هاريل موشيوف، نيف بونو، إيتاي أسرف. تصوير: عمر يادغار
رابط لصورة المجموعة البحثية. من اليمين إلى اليسار: البروفيسور مارك ليست، الشيخ كارول، هاريل موشيوف، نيف بونو، إيتاي أسرف. تصوير: عمر يادغار

وجد أن نموذج "المجموعة" مفيد للغاية في إعادة بناء النقوش العبرية والآرامية التالفة. وقال البروفيسور ليست: "نعتقد أن هذا النهج يمكن أن يمتد بسهولة إلى كتابات باللغات القديمة الأخرى الغنية من الناحية الشكلية"، وأضاف: "في قدرتنا على مساعدة المؤرخين المنخرطين في إعادة بناء المخطوطات والكتابات اليهودية القديمة كمهمة حياتهم لإكمال النص المفقود بأكبر قدر ممكن من الدقة."

تم تقديم الورقة البحثية المبنية على المشروع النهائي في مؤتمر أوروبا الوسطى للغويات الحاسوبية (EACL الذي عقد مؤخرًا في جزيرة مالطا). 

المزيد عن الموضوع على موقع العلوم:

تعليقات 5

  1. נראה על פניו שיש משהו מאוד בעייתי במתודה
    לא ברור אלו טקסטים היו היעד לפיענוח אבל בהנחה שהשימוש המרכזי בפתרון כזה יהיה מיועד דוקא לספרות תורנית מלבד התנ”ך הרי שהבסיס ללמידה לא יכול בשום אופן להיות פסוקים מהתנ”ך בטח שלא כבסיס עיקרי ובלעדי.
    כמות ואופי הטקסטים הינו עצום, מגוון, בעל איפיונים משתנים בין המחברים והתקופות השונות וגם השפעות גיאוגרפיות.
    לשם כך דרוש מיפוי הרבה יותר נרחב ולמידה המבוססת על איפיונים מגוונים ומותאמת ליעד.
    לא דומה טקסט מהתלמוד לזה מהמשנה, טקסט מהמדרש או אפילו בתוך המדרשים השונים שיש להם סגנון שפה יחודית כל מדרש בעצמו, אינו דומה סגנונו של רש”י לזה של הרמב”ן בפרשנות על התורה, וכך בגמרא ביו רש”י לתוספות.

    כך שאם רוצים באמת להגיע למשהו בעל ערך משמעותי שיוכל לסייע הן בפיענוח כתבים עתיקים והן באיתור כתבים שלמים שלא אותרו עד היום, נדרש מחקר הרבה יותר רציני ומעמיק, ובוודאי שזה חייב להיות בסיוע והתייעצות עם תלמידי חכמים בעלי ידע נרחב והבנה של החומרים השונים. אין שום סיכוי שאנשים שנעדרי הבנה בטקסט ונעדרי ידע נרחב בתורה יהיו בכלל מסוגלים לקבוע את הכללים וההתוויות הנדרשות ליישום בעל ערך.

  2. משהו מאוד בעייתי במתודה
    לא ברור אלו טקסטים היו היעד לפיענוח אבל בהנחה שהשימוש המרכזי בפתרון כזה יהיה מיועד דוקא לספרות תורנית מלבד התנ”ך הרי שהבסיס ללמידה לא יכול בשום אופן להיות פסוקים התנ”ך בטח שלא כבסיס עיקרי ובלעדי.
    כמות ואופי הטקסטים הינו עצום מגוון בעל איפיונים משתנים בין המחברים והתקופות השונות וגם השפעות גיאוגרפיות.
    לשם כך דרוש מיפוי הרבה יותר נרחב ולמידה המבוססת על איפיונים מגוונים ומותאמת ליעד.
    לא דומה טקסט מהתלמוד לזה מהמשנה, טקסט מהמדרש או אפילו בתוך המדרשים השונים שיש להם סגנון שפה יחודית כל מדרש בעצמו, אינו דומה סגנונו של רש”י לזה של הרמב”ן בפרשנות על התורה, וכך בגמרא ביו רש”י לתוספות.

    כך שאם רוצים באמת להגיע למשהו בעל ערך משמעותי שיוכל לסייע הן בפיענוח כתבים עתיקים והן באיתור כתבים שלמים שלא אותרו עד היום , נדרש מחקר הרבה יותר רציני ומעמיק, ובוודאי שזה חייב להיות בסיוע והתייעצות עם תלמידי חכמים בעלי ידע נרחב והבנה של החומרים השונים. אין שום סיכוי שאנשים שנעדרי הבנה בטקסט ונעדרי ידע נרחב בתורה יהיו בכלל מסוגלים לקבוע את הכללים וההתוויות הנדרשות ליישום בעל ערך.

  3. هناك أيضًا مسألة حقوق الطبع والنشر، والتي يشعر المصورون بالغيرة منها لدرجة أنهم يستطيعون المطالبة بما يعادل دخل الموقع لمدة ثلاث سنوات مقابل صورة واحدة.

  4. أصبح الموقع مهووسًا بالصور التي تم إنشاؤها في DALEE.
    سأكون أكثر سعادة إذا حصلت على صورة ذات صلة بالمحتوى.
    شيء يمكنك التعلم منه، وليس صورة توضيحية غير ضرورية مصنوعة باستخدام الذكاء الاصطناعي.

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.