تغطية شاملة

تقدم إنتل: الحوسبة متعددة الحواس

أصدرت شركة إنتل هذا الأسبوع طلبًا غير عادي لمطوري التطبيقات، للتحدث إلى الكمبيوتر

يجال يانكو. صورة إنتل للعلاقات العامة
يجال يانكو. صورة إنتل للعلاقات العامة

أصدرت شركة إنتل هذا الأسبوع طلبًا غير عادي لمطوري التطبيقات، للتحدث إلى الكمبيوتر. تدعو إنتل مطوري التطبيقات إلى تطوير تطبيقات التعرف على الكلام، وأعلنت أن مجموعة أدوات تطوير برامج الحوسبة الإدراكية من إنتل (SDK) - متاحة الآن للتنزيل هنا.

تعتقد إنتل أن الحوسبة الإدراكية من المتوقع أن تحدث ثورة في الطريقة التي يتفاعل بها الأشخاص مع أجهزة الكمبيوتر الخاصة بهم. تتيح مجموعة أدوات تطوير البرامج التي تقدمها إنتل الآن في مجال الحوسبة الإدراكية للمطورين تطوير التطبيقات حول إمكانيات مثل التعرف على الوجه عن قرب، وتتبع إصبع المستخدمين، وتحليل الوجه، وتتبع الكائنات ثنائية وثلاثية الأبعاد - والآن أيضًا الكلام تعرُّف.

تدعو Intel مطوري التطبيقات إلى تطوير تطبيقات التعرف على الكلام. أعلنت الشركة أن مجموعة تطوير برامج الحوسبة الإدراكية Intel (SDK)، والتي من المفترض أن تدعم التعرف على الكلام الخاص بـ Nuance، متاحة الآن للتنزيل. سيتمكن المطورون الآن من إضافة الأوامر الصوتية والجمل القصيرة وتحويل النص إلى كلام إلى التطبيقات التي يطورونها لأجهزة الكمبيوتر التي تستخدم معالجات سلسلة Core من Intel.

في مركز التطوير في حيفا، يعمل فريق بقيادة مولي آدن، رئيس شركة إنتل إسرائيل، حاليًا على موضوع الحوسبة الإدراكية. يعتمد الفريق على خريجي الشركة الناشئة Invision Mikneam، التي اشترتها شركة Intel، إلى جانب موظفين آخرين في الشركة، الذين هم الآن في مجموعة الحوسبة الإدراكية في Intel Haifa.

لفهم ما يدور حوله الأمر، وخاصة سياق الإعلان، الذي جاء بعد فترة وجيزة من إعلان مماثل حول التعرف على الإيماءات باستخدام الكاميرا، المخصص لهؤلاء المطورين، تحدثنا مع ييجال يانكو، المسؤول عن التخطيط الاستراتيجي في مجال الحوسبة الإدراكية في شركة إنتل العالمية في مركز تطوير إنتل في حيفا.

"فيما يتعلق بإعلانات إنتل، فهذه ميزة إضافة إلى SDK التي أعلنا عنها في منتدى مطوري إنتل (IDF) في سبتمبر الماضي. لقد وعدنا بإضافة ميزات ومنذ شهر تقريبًا أعلنا عن ميزات التعرف على الإيماءات باستخدام كاميرا تلتقط صورًا ثلاثية الأبعاد، وهذه المرة أضفنا القدرة الصوتية بالتعاون مع شركة Newnans.

توفر Intel مجموعة أدوات تطوير - وليس منتجات على مستوى المنتجات النهائية. ولكننا قدمنا ​​لهم عدداً من التطبيقات الأساسية لتوضيح قدرات التكنولوجيا ومن هناك يمكن للجميع أن يأخذوها حسب مخيلتهم وإمكانياتهم."

وفاة لوحة المفاتيح QWERTY
وفقا لجانكو، فإن قوة الحوسبة تتزايد باستمرار، ولكن لعقود من الزمن لم تتغير الواجهات معها. "لا يعلم الكثيرون، ولكن تم تطوير لوحة مفاتيح QWERTY لإبطاء الكتابة على الآلات الكاتبة. في السنوات الأخيرة، بدأ الناس يعتادون على استخدام شاشات اللمس، وهذه خطوة صغيرة في الاتجاه الصحيح، ولكنها ليست كافية."
يوضح يانكو: "المستقبل يكمن في الواجهات الطبيعية". "نريد تجربة بديهية تتيح لعدد أكبر من الأشخاص استخدام الحوسبة. نعود إلى أصلنا - إلى تطور العيون والأذنين وحواس اللمس والصوت ونفضل أن يكيف الكمبيوتر نفسه معنا وليس أن نكيف أنفسنا مع الكمبيوتر. لوحة المفاتيح والماوس ليسا وسيلة اتصال يستخدمها الأشخاص للتواصل مع بعضهم البعض ولكنهم مجبرون على استخدامها عند التواصل مع الأجهزة. يعد التعرف على الصوت أو إيماءات اليد أكثر سهولة بكثير، ولهذا السبب نسميها "الحوسبة الإدراكية" لأنها تسمح باستخدام الحواس في أبسط أشكالها."

ما هي الصعوبات في التنفيذ؟
يانكو: الصعوبة الرئيسية في التنفيذ هي الحاجة إلى إقناع الناس باستخدامه. يثبت تاريخ QWERTY أنه من الصعب جدًا تغيير العادات. كانت شاشات اللمس موجودة أيضًا منذ 15 عامًا، ولكن فقط منذ ظهور iPhone، بدأ استخدام هذه الميزة على نطاق واسع. بالإضافة إلى ذلك، بالطبع، كلما كانت الواجهة أكثر سهولة، كلما زادت قوة المعالجة المطلوبة، ويجب أن تكون مكونات الكمبيوتر أكثر قوة - سواء كانت الكاميرات التي تحتاج إلى أن تكون ثلاثية الأبعاد مثل أعيننا، أو نظام معالجة الصوت يتطلب الكثير من القوة لأنه لا يعمل في بيئة الصمت التام وبعدد محدود من الكلمات من متحدث معين في تطبيق معين ولكن في أي ظروف ضوضاء في الخلفية، مع عدد لا نهائي من الكلمات ومن كل مستخدم. يحتاج النظام أيضًا إلى فهم ما يقال له من السياق، كما نفعل نحن."

"في التجربة الطبيعية، نعمل مع مجموعة من الحواس، وكذلك في الاتصال الصوتي، مثل المكالمة الهاتفية، هناك نغمة، ونقوم بتصفية ضوضاء الخلفية. ومع ذلك، في محادثة وجهاً لوجه، يتحدث الناس بأعينهم وأيديهم وصوتهم وحركات شفاههم - التواصل اللفظي وغير اللفظي. والمنصة التي تريد إنتل تقديمها هي الجمع بين هذه الحواس معًا في تجربة طبيعية."

مثلا؟
"في الواقع، إذا أعطاني شخص ما إشارة توقف أو مجرد إشارة يدوية، فإنني أفهم ذلك بسرعة. بالنسبة لجهاز الكمبيوتر، تعد هذه مهمة صعبة لمعالجة الصور. هذه صور معقدة للغاية ويجب معالجتها وفهم ما تعنيه. منذ وقت ليس ببعيد، ظهرت كاميرا محيطية، يمكنك توصيلها بجهاز Soft Kinetic Ultra Book وهي قادرة على التعرف على مثل هذه الإيماءات."

فهل سيكون من الممكن القول بأن الحوسبة الإدراكية لن تكتمل إلا عندما يتم العثور على بديل رقمي لجميع الحواس؟

"اليوم نقدم للمطورين الدعم الأساسي للكاميرا، والأنظمة الأساسية للتعرف على الصوت والتعرف على الإيماءات. ليس عليك الانتظار حتى يصبح كل شيء مثاليًا ثم دمجهما. ويجب أن نتذكر أن هذا يشبه جسم الإنسان: فتفوق إحدى الحواس يعوض عن دونية حاسة أخرى. مع تقدم التكنولوجيا على مر السنين، سنكون قادرين على دعم الأجهزة الأكثر تقدمًا. "

وكمثال على تطبيقات الحوسبة الإدراكية، قدمت إنتل "لعبة الله" التي تسمح بتحريك الأجسام في النظام الشمسي. لعبة أخرى قام بتطويرها من خلال الشركة المصنعة للكاميرا Soft Kinetic هي "Lightning" والتي تسمح بإنتاج البرق في الواقع المعزز بين راحتي اليدين وفقًا لإيماءات الجسم. في لعبة Softkinetic أخرى تسمى Ballista، يقوم اللاعبون "بإطلاق" المقاليع وقذائف المدفعية من خلال التعرف على إيماءات أجسادهم.

لتحقيق الحوسبة الإدراكية. مع تقدم الكمبيوتر في الطلب على تقليد الطبيعة، فإنه يتطلب قدرة كبيرة على معالجة البيانات، سواء كانت دقة الفيديو في الوقت الفعلي، أو التعرف على الكلام بشكل أكثر دقة. تم دمج الأشياء في منصات Intel التي توفر قوة حوسبة عالية مع استهلاك منخفض للطاقة. وفي لعبة أخرى، يمكنك إطلاق كرات ثلاثية الأبعاد على الحصن.

"نعمل بشكل متزامن على الأجهزة التي تحاكي الحواس مثل الكاميرات ومحركات الكلام وغيرها من الوسائل التي لا نستطيع ذكرها في الوقت الراهن، ودمجها في بيئة تطويرية واحدة. آمل، كما حدث مع iPhone، أن يجد مجتمع المطورين التركيبات الصحيحة، وأنا متأكد من أن العديد من الأشياء التي لم نفكر فيها، ستحدث. "في بيئة التطوير، قدمت إنتل أمثلة تجريبية للمطورين توضح ما يمكن القيام به، ولكن الفكرة هي أن الخيال لا يبقى معنا فقط وآمل أن يفعل الناس به أشياء كثيرة تتجاوز ما اعتقدنا"، يانكو يقول في الختام.

تعليقات 3

  1. أوصي Intel بتحديث SDK إلى C# إذا أرادوا أن يفكر مبرمجو واجهة المستخدم في استخدامه. في هذه الأثناء، يعد Microsoft Kinect SDK أكثر إثارة للإعجاب.. ولكن على أي حال المنافسة جيدة والمشروع مبارك..

  2. لم أفهم - لماذا نعيد اختراع العجلة؟ سيري على iPhone لا يتحدث إلى جهاز كمبيوتر؟

    اعتقدت أن هذه التكنولوجيا تم اختراعها بالفعل.

  3. آسف، ولكن مع احترامي للتكنولوجيا، التي هي جميلة في حد ذاتها، يبدو لي أن استخدام الماوس ولوحة المفاتيح التقليدية أسهل بكثير وأكثر ملاءمة من البدء في التلويح بيديك أمام الكمبيوتر (متعب) أو التحدث معها بصوت عال. علاوة على ذلك، لا أفهم كيف يمكنك التركيز على أعمال التطوير ضمن فريق بينما يجلس الأشخاص الموجودون في الغرفة من حولك ويتحدثون إلى أجهزة الكمبيوتر الخاصة بهم.

    لا أعتقد أنه عملي على الإطلاق.

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.