تغطية شاملة

تمكن العلماء من تقليص حجم ملف الموسيقى إلى جزء من الألف من حجمه بتنسيق MP3

يحتوي ملف الموسيقى على عزف منفرد للكلارينيت لمدة 20 ثانية ويتم ترميزه بأقل من XNUMX كيلو بايت. أصبح الاختراع ممكنًا بفضل ابتكارين مهمين: إنشاء محاكاة تحاكي الكلارينيت الحقيقي على الكمبيوتر ومحاكاة عازف الكلارينيت نفسه

الكلارينيت الألماني. من ويكيبيديا
الكلارينيت الألماني. من ويكيبيديا

تمكن الباحثون في جامعة روتشستر من إنشاء موسيقى رقمية في ملف أصغر بألف مرة من ملف MP3 القياسي. يحتوي ملف الموسيقى على عزف منفرد للكلارينيت لمدة 20 ثانية ويتم ترميزه بأقل من XNUMX كيلو بايت. أصبح الاختراع ممكنًا بفضل ابتكارين مهمين: إنشاء محاكاة تحاكي الكلارينيت الحقيقي على الكمبيوتر ومحاكاة عازف الكلارينيت نفسه.

وأعلن الباحثون عن الإنجاز الجديد في المؤتمر الدولي لمعالجة الإشارات والصوتيات الذي عقد في لاس فيغاس. لم تتم بعد عملية إعادة بناء كاملة لأداء الكلارينيت الأصلي، لكن الباحثين يقولون إنهم يقتربون من ذلك.

يقول مارك بوكو، أستاذ الهندسة الكهربائية وهندسة الكمبيوتر والمشارك في ابتكار التكنولوجيا الجديدة: "هذه هي في الواقع الطريقة التي يصنع بها البشر الموسيقى". "لا ينبغي أن تكون هناك حاجة لقياس الموسيقى آلاف المرات في الثانية، كما نفعل مع الأقراص المضغوطة. لا يستطيع الناس التلاعب بلسانهم وأصابعهم وأنفاسهم بهذه السرعة."

عندما يقوم الكمبيوتر بتشغيل الموسيقى وفقًا للملف الجديد، فإنه يعيد إنتاج الأداء الأصلي عمليًا، استنادًا إلى كل ما يعرفه عن الكلارينيت وعزف الكلارينيت. قام اثنان من طلاب الدكتوراه من جماعة بوكو، شياو شياو دونغ ومارك ستيرلينغ، بقياس وتقدير الطرق المختلفة التي يتغير بها صوت الكلارينيت - بدءًا من الضغط الذي يمارس على ماسورة الآلة عند عزف النوتات المختلفة وانتهاء بالطريقة التي يتم بها عزف الكلارينيت. ينتشر الصوت من الجهاز. ثم قاموا بإنشاء نموذج كمبيوتر للكلارينيت. والنتيجة هي آلة موسيقية افتراضية تعتمد بالكامل على قياسات صوتية من العالم الحقيقي.

بعد أن أنشأ الباحثون الكلارينيت الافتراضي، استمروا في إنشاء المشغل الافتراضي. وقاموا بمحاكاة الطريقة التي يتلاعب بها عازف الكلارينيت بالآلة، بما في ذلك موضع الأصابع وقوة الضربة والضغط الذي تمارسه الشفاه من أجل تحديد كيفية استجابة الكلارينيت الافتراضي لكل هذه الأمور. الآن، يقول بوكو، يحتاج الكمبيوتر ببساطة إلى "الاستماع" إلى أداء الكلارينيت الحقيقي لفك تشفير وتسجيل الإجراءات المختلفة اللازمة لإنشاء صوت معين. من أجل إعادة إنتاج الصوت الأصلي، يقوم الكمبيوتر بتغذية قائمة الإجراءات التي سجلها إلى النموذج المحوسب لمشغل الكلارينيت. والنتيجة هي نسخة قريبة جدًا من الصوت الأصلي، حتى لو لم تكن مثالية بعد.

يقول بوكو: "ما زلنا نحاول دمج الطريقة التي يعمل بها اللسان، لنفهم، على سبيل المثال، كيف يضرب العازف بلسانه على فم الكلارينيت من أجل عزف النغمات المتقطعة [منفصلة عن بعضها البعض، آر سي]". "لكن في الموسيقى ذات النوتات الطويلة التي تندمج مع بعضها البعض، تعمل الطريقة بشكل جيد ويصعب التمييز بين الصوت المحوسب والأصل".

الطريقة الحالية قادرة على التعامل مع آلة موسيقية واحدة فقط، لكن باحثين آخرين في مختبر أبحاث الموسيقى بجامعة روتشستر تمكنوا من إيجاد طريقة قادرة على تمييز أصوات عدة آلات يتم العزف عليها معًا. قد يؤدي الجمع بين الطريقتين إلى طريقة جديدة يمكننا من خلالها تسجيل الموسيقى وتشغيلها، مع الحد الأدنى من المعلومات المحفوظة.

ويعتقد الباحثون أنه عندما يتم إتقان الطريقة، فإنها قد تمنح فنيي الكمبيوتر طرقًا أكثر سهولة لإنشاء الموسيقى، من خلال تضمين تصرفات الموسيقيين الافتراضيين في أجهزة المزج المحوسبة. وتدعي بوكو أنه من حيث المبدأ يمكن تعميم هذه الطريقة على الأصوات البشرية أيضًا. إن النماذج التي تحاكي الحبال الصوتية والممرات الهوائية البشرية معقدة للغاية بالفعل، ولكن إذا كان على حق، فقد نسمع في غضون سنوات قليلة مطربين جدد على الراديو، والذين سيكونون محوسبين بالكامل. سيكون بمقدور أي شخص مهووس بالكمبيوتر أن يفخر بأحبال بافاروتي الصوتية الغنية، مع تنزيل البرنامج المناسب (بترخيص كامل بالطبع) من الشبكة. سيتم نقل الأعمال الأوبرالية الأكثر تعقيدًا إلى الكمبيوتر وستتلقى لمسات جديدة. وكل هذا بالطبع مع الحد الأدنى من الذاكرة المحفوظة على الكمبيوتر. وكما يقول بوكو، "أعتقد أننا وجدنا الطريقة التي تتطلب أقل قدر ممكن من المعلومات لتشغيل مقطوعة موسيقية."

ولا يسعنا إلا أن نتساءل - هل سيأتي اليوم حقًا عندما نسمع بابا لوبا وأوم كول توم يغنيان الثنائي من "فانتوم الأوبرا" لبعضهما البعض؟ وهل يستحق الأمر حقًا التطلع إلى مثل هذا اليوم؟

الإجابات، كالعادة، لن تجدها إلا في المستقبل.

المصدر (مع العينات الصوتية للقطعة الموسيقية الأصلية وتسجيلها بالطريقة الجديدة) :

تعليقات 12

  1. ح. الاول:
    وما قلته صحيح ودقيق.
    أكرر - ليس من الممكن على الإطلاق ضغط مجموعة عشوائية من البتات (إذا كانت كل مجموعة من البتات ذات احتمالية متساوية). واضح وسلس.
    ويمكن إثبات ذلك رياضيا.

  2. وشيء آخر.. لا علاقة له بالانكماش..
    قال مايكل "من المستحيل تمامًا ضغط مجموعة عشوائية تمامًا من البتات حتى من الناحية النظرية" وهذا صحيح ولكنه ليس دقيقًا.. من الممكن الضغط إلى حد معين (والذي يمكن أن يكون قريبًا جدًا من الحجم الأصلي) ولكن هذا حيث ينتهي. ZIP هو مثال جيد على ذلك.

    ليس هناك تقليص هنا، بل حفظ المعلومات بصيغة معينة حول {النوتات وقوة الزفير وزمن الزفير}.
    ومن المعرفة المسبقة (!!!!!!!!!!) أن هذا كلارينيت وهذه البيانات، يقوم البرنامج بترجمة البيانات إلى أصوات.

    إذا تم إدراج غيتار أيضًا، فسيحتاج الملف بالفعل إلى تنسيق أكثر "سمينة" لأن البرنامج لا يمكنه معرفة، على سبيل المثال، ما إذا كان من المفترض أن تكون النوتة الموسيقية الموجودة في الملف عبارة عن نغمة جيتار أو نغمة كلارينيت. ربما يكون للجيتار أيضًا خصائص لا يمتلكها الكلارينيت والعكس صحيح.

    باختصار، لقد اخترعوا تنسيقًا موثوقًا ومستقرًا لملف الكلارينيت!
    لم يتم ضغط أي شيء. إنه سكر. إلى وجهك 😉

  3. فكرة ممتازة وكان ينبغي تنفيذها في التسعينيات - إنها ليست بهذا التعقيد (بالنظر إلى عدد من خبراء الموسيقى وعدد قليل من المبرمجين).
    من الممكن أيضًا بناء نماذج رياضية تُظهر "تحويل" الموسيقى إلى أشكال ثلاثية الأبعاد في الوقت الفعلي (باستخدام برنامج matlab أو أداة مشابهة)، مما سيعزز فهم الموسيقى والاستمتاع بها.

    ودعنا نبدأ العمل، هناك آلة موسيقية أخرى معروضة للبيع، وعندما تكون هناك "حزمة آلات موسيقية" للبيع، سيتمكن الموسيقيون أخيرًا من فعل ما يريدون حقًا دون الحاجة إلى فرقة موسيقية ونفقات مالية ضخمة غير ضرورية 🙂

  4. 6:
    ازدرائك في غير محله.
    تم تصميم جميع طرق الضغط لضغط المواد غير العشوائية لأنه من المستحيل تمامًا ضغط مجموعة عشوائية تمامًا من البتات حتى من الناحية النظرية.
    ولهذا السبب فإن البرامج التي تضغط الصورة تضع افتراضات معينة حول العالم، والبرامج التي تضغط النص تضع افتراضات أخرى.
    يبدو لي أن أدوات ضغط الكلام والموسيقى أكثر إثارة للاهتمام بالنسبة لمعظم الناس من أدوات ضغط الانتفاخ ومن المحتمل أن يحتوي القاموس الذي سيتم تطويره على عدد محدود جدًا من الأشياء المثيرة للاهتمام ومفهوم عام لـ "كل شيء آخر" سيتم إرسالها بدون ضغط أو بضغط أكثر بدائية.

  5. وبالطبع الأمعاء التي ينفخ الهواء من خلالها
    بهذه الطريقة سيكون من الممكن تسجيل نفخة مدتها 20 ثانية بأقل من كيلو بايت واحد!

    ثم هناك صوت محرك السيارة، وطول جناحي طائر القطرس أبيض الصدر، ومئات الملايين من مصادر الصوت الأخرى. في الواقع طريقة اقتصادية للغاية. لقد نسوا للتو أن يذكروا أن حجم "القاموس" سيكون حوالي عدة عشرات من الجيجابايت

  6. الفرق بين هذا والميدي يكمن في طريقة التسجيل، حيث تكمن الصعوبة في تحديد الأصوات التي يتم تشغيلها.

  7. إنه لا يختلف حقًا عن مبدأ MIDI
    بدلاً من السماح للكمبيوتر بتشغيل الموسيقى المسجلة، فإنك تعطيه الملاحظات بحيث "يعزف" من خلال محاكاة آلة موسيقية (عندما تعني كلمة MIDI عضوًا)

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.