تبلغ كثافة المعلومات في الحمض النووي حوالي مائة مليون مرة أكبر من كثافة التخزين الرقمي. وهذا يعني أنه بالنسبة لكل وحدة حجم تحتوي حاليًا على 1 ميغا بايت، من المحتمل أن نتمكن من تخزين ما يصل إلى 100 تيرابايت.
طوّر باحثون في كلية تاوب لعلوم الحاسوب طريقةً قائمةً على الذكاء الاصطناعي تُسرّع استرجاع المعلومات من قواعد البيانات القائمة على الحمض النووي (DNA) بثلاثة أضعاف، وتُحسّن دقتها بشكل ملحوظ. ضمّ فريق الباحثين طالب الدكتوراه عمر تزابري، والدكتورة دانييلا بارليف، والدكتور إيتاي أور، والبروفيسور إيتان يعقوبي، والبروفيسور طوفي عتصيون.
يعد تخزين المعلومات في الحمض النووي مجالًا بحثيًا جديدًا واعدًا، وجوهره هو استخدام الحمض النووي كمنصة لتخزين المعلومات. يتمتع الحمض النووي بمزايا كبيرة باعتباره نظامًا لتخزين المعلومات، بما في ذلك الحفاظ على المعلومات لفترات زمنية هائلة؛ انخفاض كبير في تكاليف الطاقة والاقتصاد والأضرار البيئية؛ وزيادة في كثافة المعلومات، وهو ما يعني انخفاضاً هائلاً في سعة التخزين.
في سياق "مدة الصلاحية" في عام 2013، تمكن باحثون من الدنمارك من استخراج الحمض النووي من عظم حصان عاش قبل 700,000 ألف عام. في عام 2021، نجح فريق دولي في استخراج الحمض النووي من الماموث الذي عاش قبل أكثر من مليون عام. وبالمقارنة، فإن عمر القرص المغناطيسي، مثل تلك المستخدمة في مزارع الخوادم، يقاس بالسنوات أو بضعة عقود على الأكثر. ومن ثم، فإن القفزة العملاقة المتوقعة في مجال التخزين على المدى الطويل واضحة.
في السياق الاقتصادي والطاقة ومن الجدير بالذكر أن "السحابة"، التي تزودنا بمعظم خدمات الحوسبة، تعتمد على مزارع الخوادم التي تستهلك حالياً نحو 3% من استهلاك الكهرباء العالمي، وتنبعث منها نحو 2% من إجمالي انبعاثات الكربون. وبما أن كمية المعلومات تتزايد بشكل كبير، فمن الواضح أن الضرر البيئي المتوقع نتيجة للاستمرار في استخدام التقنيات الحالية سوف يستمر في النمو بشكل مطرد.
فيما يتعلق بكثافة المعلومات - كثافة المعلومات في الحمض النووي أكبر بمئة مليون مرة من كثافة التخزين الرقمي. وهذا يعني أنه بالنسبة لكل وحدة حجم تحتوي حاليًا على 1 ميغا بايت، من المحتمل أن نتمكن من تخزين ما يصل إلى 100 تيرابايت.
DNA هو جزيء يتكون من سلسلة من المركبات العضوية تسمى النيوكليوتيدات. تنقسم هذه إلى أربعة أنواع، يرمز لها بالحروف T وG وC وA. وبناءً على ذلك، إذا كانت المعلومات في الحوسبة التقليدية ممثلة برقمين فقط - 0 و1 - فإن التخزين في الحمض النووي يعتمد على تسلسلات مكونة من أربعة أحرف، مما يزيد بشكل كبير من عدد التركيبات الممكنة.
لكتابة (تخزين) المعلومات في هذه التقنية، يلزم إجراء عملية التركيب (تركيب الحمض النووي) - إنشاء جزيئات الحمض النووي وفقًا للتسلسل الذي يشفر المعلومات؛ ولقراءة المعلومات، لا بد من إجراء تسلسل الحمض النووي.
يرافق تطوير تكنولوجيا تخزين الحمض النووي العديد من التحديات التكنولوجية. أولاً، كل من التركيب والتسلسل عبارة عن عمليات طويلة ومزعجة تؤدي إلى إدخال أخطاء في المعلومات الناتجة. هذه هي أخطاء الإدراج/الحذف/الاستبدال بشكل أساسي. بالإضافة إلى ذلك، وبسبب القيود المفروضة على عملية التركيب، يتم إنشاء العديد من النسخ لكل جزيء من جزيئات الحمض النووي التي تشفر المعلومات أثناء العملية. يتم تخزينها معًا، دون ترتيب، في وسيط تخزين يشكل نظام الذاكرة. أثناء التسلسل، يتم الحصول على العديد من النسخ غير الصحيحة من هذه الجزيئات؛ معظمها تحتوي على أخطاء وبعضها يختفي تماما. وتقدم الدراسة الحالية حلاً حسابيًا شاملاً لاسترجاع المعلومات وتصحيح الأخطاء في هذه الأنظمة المعقدة، باستخدام خوارزميات وطرق مبتكرة لترميز المعلومات واسترجاعها. ومن خلال التجارب، أظهر الباحثون أن الحل الذي طوروه يسمح تقصير الوقت المستغرق لاسترجاع المعلومات وقراءتها من أيام إلى 10 دقائق.
الطريقة التي طورها باحثو معهد التخنيون، DNAformer، تتكون من نموذج ذكاء اصطناعي تم تدريبه على بيانات محاكاة (تم إنشاؤها باستخدام جهاز محاكاة تم تطويره في معهد التخنيون) حتى يتمكن من إعادة بناء تسلسلات الحمض النووي بناءً على نسخها غير الصحيحة. بالإضافة إلى ذلك، تحتوي الطريقة أيضًا على رمز تصحيح أخطاء مخصص فريد من نوعه للحمض النووي، والذي يحافظ على المعلومات بطريقة مقاومة للخطأ. بالإضافة إلى كل هذا، تم تطوير آلية أمان إضافية يمكنها تحديد تسلسلات الحمض النووي الصاخبة بشكل خاص وتطبيق أدوات خوارزمية قوية عليها بشكل فعال. وفي نهاية العملية، يتم تحويل كل شيء مرة أخرى إلى معلومات رقمية.
وتتيح الطريقة الجديدة التي قدمها الباحثون قراءة 100 ميغا بايت من المعلومات بسرعة أكبر بـ3,200 مرة من الطريقة الأكثر دقة التي كانت موجودة حتى اليوم، دون فقدان الدقة. وبالمقارنة بالطرق الأخرى التي كانت تعتبر سريعة حتى هذا التطور، فإن الطريقة الجديدة تقدم تحسين الدقة بنسبة تصل إلى 40٪ بالإضافة إلى التحسن الكبير في الأوقات. وقد تم توضيح هذه القدرات على 3.1 ميغابايت من البيانات، والتي تضمنت صورة ثابتة ملونة، ومقطع صوتي مدته 24 ثانية يتضمن تصريحات رائد الفضاء نيل أرمسترونج على القمر، ونص مكتوب عن فضائل الحمض النووي كطريقة تخزين واعدة. [כאן]
ويعتزم الباحثون تطوير إصدارات تعتمد على DNAformer بحيث تتناسب مع احتياجات مختلفة. ويوضحون أيضًا أن التكنولوجيا التي طوروها قابلة للتطوير والتكيف، وهذا يعني أنه يمكن تكييفها مع كميات كبيرة جدًا من المعلومات التي تلبي احتياجات السوق وتقنيات التوليف والتسلسل المستقبلية.
تم دعم البحث من قبل المفوضية الأوروبية للأبحاث (منحة ERC)، وهيئة الابتكار الأوروبية (منحة EIC، مشروع DiDAX)، ومؤسسة العلوم الإسرائيلية (ISF).
المزيد عن الموضوع على موقع العلوم:
تعليقات 2
(صغير، **ثمانية** أوامر من حيث الحجم)
لقد قاموا بمقارنة جيدة بين كثافة سعة التخزين الرقمية وكثافة الحمض النووي. لا يوجد مقارنة مماثلة لأوقات الوصول للقراءة والكتابة بين وسائط التخزين.
لنفترض أن 10 دقائق للحمض النووي. كم سعر الفلاشة؟ ما هي النسبة؟