تغطية شاملة

أيها الكمبيوتر، ارسم لي خروفًا على خلفية ريفية

حتى لو لم تكن موهوبًا في الرسم والتلوين، فإن برنامج Sketch2Photo سيستدعي الفنان المخفي بداخلك ويساعدك على إنشاء روائع فنية محلية الصنع

الجزء الداخلي من جهاز كمبيوتر منزلي، من ويكيبيديا
الجزء الداخلي من جهاز كمبيوتر منزلي، من ويكيبيديا

الصور غالبا ما تكون أفضل من النص. إنها تجذب الانتباه، وتنقل رسائل تتضمن حقائق ومشاعر، وتخلق انطباعات تبقى لفترة طويلة بعد نسيان النص. والسبب واضح: لقد أعدتنا مئات الملايين من السنين من التطور لفك تشفير الصور بسرعة ومعالجة المعلومات الموجودة فيها وتذكرها والرد عليها.

ومع ذلك، فإن القدرة على استخدام هذه الميزة لتحسينالتواصل بين الأشخاص محدود لدى معظمنا: الأفراد الفاضلون فقط هم الذين يتمتعون بالقدرة على إنشاء صور مقنعة وتواصلية ومهارات إبداعية في الفنون الرسومية والبصرية.

في عصر الكمبيوتر وאינטרנט يمكننا تحسين المستندات والرسائل التي نقوم بإنشائها عن طريق إضافة صور من المجموعة الواسعة التي يمكن العثور عليها على الإنترنت. يتم تحسين أدوات البحث عن الصور باستمرار، وتقترب من النقطة التي يمكننا فيها البحث عن الصور حسب تصميمها وليس فقط عن طريق النص المتعلق بها أو الذي يظهر بجانبها.

ومع ذلك، في بعض الأحيان نريد أن ننقل رسالة من خلال الجمع بين عدة أشياء - على سبيل المثال، ديناصور على خلفية مباني المكاتب، أو طفل يركب سيارة دراجات ويقود وراءه قطيعًا من الأغنام نحو الجبال. في مثل هذه الحالة، من المحتمل أنه حتى من بين مليارات الصور الموجودة على الإنترنت، لن نتمكن من العثور على الصورة المناسبة.

يمكن لفناني الجرافيك المحترفين، بالطبع، إنشاء مثل هذه الصور من خلال الجمع بين أجزاء من عدة صور مختلفة، باستخدام برامج تجارية (مثل Photoshop أو Pixel Image Editor). إنهم يعرفون كيفية اختيار الصور المناسبة من حيث الإضاءة وتكوين الألوان والمنظور وما إلى ذلك، ودمجها بحيث لا تكون "الطبقات" مرئية. إلا أن البرامج التجارية لا تساهم في الجزء الأول (اختيار الصور)، وتتطلب معرفة وخبرة لأداء الجزء الثاني (تجميع الصور).

رسومات بدون فنانين جرافيك

يقدم فريق من الباحثين من الصين وسنغافورة وإسرائيل طريقة مختلفة لإنشاء الصور، يمكن الوصول إليها حتى لأولئك الذين يفتقرون إلى الموهبة والتدريب في الفنون البصرية. شي مين هو، وتاو تشين، ومينغ مينغ تشينغ (هو، تشين، تشنغ من جامعة تسينغهوا، بينج تان من جامعة سنغافورة الوطنية وارييل شاميرمن المركز متعدد التخصصات في هرتسليا قاموا بتطوير برنامج يسمى سكتش 2 فوتو("من التسجيل إلى التصوير الفوتوغرافي"). في هذا البرنامج، يسجل المستخدم قائمة بسيطة بالكائنات الموجودة في الصورة المطلوبة وبجانب كل كائن وصف لفظي.

يبحث البرنامج في الإنترنت عن الصور المناسبة لكل مكون من المكونات المطلوبة، ويجمعها معًا لإنشاء صور مرشحة لإدراجها في التكوين النهائي. بعد ذلك، تختار من بين المرشحين الصور التي تتناسب معًا بأفضل طريقة، و"تسحب" الأجزاء المناسبة من الصور و"تلصقها" معًا.

تم تقديم المزيد من المعلومات حول Sketch2Photo في مقال جديد في المؤتمر ACM-سيغراف آسيا عُقد مؤتمر SIGGRAPH في ديسمبر الماضي في مدينة يوكوهاما باليابان، وهو عبارة عن مجموعة اهتمامات (SIG: Special Interest Group) مخصصة لرسومات الكمبيوتر، ويتم في مؤتمراتها عرض التطورات الجديدة في التطبيقات والتقنيات في هذا المجال.

ومن المثير للاهتمام دراسة تقسيم الأدوار بين الشخص والكمبيوتر: فالشخص مسؤول عن العمل الإبداعي المتمثل في اتخاذ القرار بشأن تكوين الصورة، بحيث تناسب الرسالة المطلوبة. كما أنه مسؤول عن الأحجام النسبية للكائنات في الصورة، والتركيب والاتجاه الذي تظهر فيه.

ويزود التسجيل الكمبيوتر بهذه المعلومات، والتي بدونها ستبدو الصورة غريبة أو تنقل رسالة مختلفة عما أراده المستخدم. وبالتالي، فإن البرنامج معفى من أي شرط لمعرفة أو فهم العالم، وإنشاء مجموعات فقط تتوافق مع الفطرة السليمة والواقع المعروف لنا. ولا يزال مثل هذا التحدي بعيدًا عن متناول الذكاء الاصطناعي اليوم.

علاوة على ذلك، إذا عرفنا كيفية تطوير برنامج لا يخلق سوى مشاهد يمكن أن توجد في الواقع، فسيحد ذلك من تنوع الصور والحرية الإبداعية: سيستبعد البرنامج المفارقة التاريخية للديناصور على خلفية مباني المكاتب. أو الخطأ البيولوجي في صورة كلب بحجم منزل، أو الخطأ الجسدي في تكوين الأجسام حيث تطفو في الهواء.

العثور على الصور المناسبة للجمع

الخطوة الأولى في تشغيل Sketch2Photo هي البحث على الإنترنت، بهدف العثور على الصور المطابقة للعناصر المطلوبة في الصورة. التحدي الأول هو صعوبة العثور على الصور وفقًا للوصف النصي: على الرغم من بعض التقدم البحثي، فإن محركات البحث عن الصور المتوفرة على نطاق واسع اليوم لا "تنظر" إلى الصور، بل إلى النص المرتبط بها.

هذه الطريقة ليست موثوقة بدرجة كافية: على سبيل المثال، أدى البحث عن الصور على Google عن كلمة "منزل"، في وقت كتابة هذا المقال، إلى ظهور صور للمنازل وأيضًا رسومات ورسوم كاريكاتورية وملصق للمسلسل التلفزيوني "House". الحل الذي يقدمه مطورو البرامج هو تصنيف الصور وفقًا للخصائص التي يستطيع الكمبيوتر تحليلها. أولاً، يقوم الكمبيوتر باختيار الصور التي لها خلفية بسيطة وموحدة.

في الخطوة التالية، يتم تحديد المخطط التفصيلي للكائن المنفصل عن الخلفية، ومقارنته بالمخطط التفصيلي الذي رسمه المستخدم. لا يتطلب البرنامج تطابقًا مثاليًا، ولكن غالبًا ما يتم استبعاد الصورة التي لا تتطابق مع الوصف النصي من خلال شرط مطابقة المخطط التفصيلي المطلوب، حتى لو جزئيًا فقط.

في الخطوة الأخيرة من تصفية الصور، يقوم البرنامج بحساب خصائص الصور التي نجت من خطوات التصفية السابقة. وهذه الخصائص عبارة عن كميات رياضية تتعلق بملمس ولون أجزاء الصورة المعزولة من الخلفية. الافتراض هو أنه عند البحث عن "فيل"، على سبيل المثال، فإن المناطق الموجودة في الصور التي تحتوي على أفيال ستكون لها خصائص مماثلة، في حين أن الصور التي لا تحتوي على أفيال وصادف أنها مرتبطة بالنص الذي يحتوي على كلمة "فيل" " - سوف يختلفون عن بعضهم البعض في خصائصهم.

إضفاء الطابع الديمقراطي على العملية الإبداعية

حتى عند اختيار الصور المناسبة، ليس من السهل تجميعها معًا. بعد العثور على أفضل سطر مطابقة لزوج من الصور المراد تجميعها معًا، يقوم البرنامج بحساب طبيعة المطابقة: قد تبدو المطابقة غير واقعية إذا كانت هناك اختلافات كبيرة في اللون والملمس.

يتم عرض النتائج النهائية مع أفضل التطابقات للمستخدم. الآن يتم منح المستخدم أيضًا الفرصة لرفض عناصر الصورة التي نجت من مراحل التصفية على الرغم من أنها لا تطابق المحتوى المطلوب، وتصحيح الأخطاء في تحديد الخطوط.

التعاون بين مختلف

هل ينذر Sketch2Photo بتسريح جماعي للعمال بين فناني الجرافيك؟ لايبدو. عندما لا تكون جودة الصورة مهمة فحسب، بل أيضًا التكوين الفني وتكييف الصورة مع الرسالة المطلوبة، فإن Sketch2Photo ليس بديلاً عن القدرة البشرية. لذلك، فإن أولئك الذين سيستفيدون من مثل هذه البرامج هم بالتحديد أولئك الذين لم يتمكنوا حتى الآن من إنشاء صور عالية الجودة مناسبة لاحتياجاتهم. وهكذا قد تظهر الديمقراطية في هذا المجال.

هناك اختلافات كبيرة بين الطرق التي يحقق بها البشر وأجهزة الكمبيوتر نفس الهدف: كما هو موضح هنا، لا يحاول Sketch2Photo التعرف على محتوى الصورة ولا "يعرف" الشكل الذي يجب أن يبدو عليه الكلب أو الفيل أو الدراجة النارية. وبدلا من ذلك، فهو يصنف الصور وفقا للإشارات اللفظية، وعلى افتراض أن الصور التي تناسب الوصف المطلوب تتشابه مع بعضها البعض، في حين أن تلك التي لا تناسب الوصف ستكون أكثر اختلافا عن بعضها البعض.

يعمل Israel Binyamini في ClickSoftware لتطوير أساليب التحسين المتقدمة.

تم نشر المقال في المجلة جاليليو، يناير 2010.

تعليقات 15

  1. صحيح جدًا، تخيل أن هناك عمالًا بشريين لا يريدون أن يتم استبدالهم بآلات متقدمة عالية التقنية.
    أين ستتطور التكنولوجيا في مثل هذه الحالة؟ أم أنها لن تتطور؟

  2. فالمستوى المتوسط ​​ليس نتيجة للتكنولوجيا، بل هو نتيجة لأسلوب حياة ناشئ عن الصفات الشخصية والتعليم.
    أعتقد أنه من الجيد أن يتم اختراع التصوير الفوتوغرافي على الرغم من أنه يسلب الرسامين مصدر رزقهم وكرامتهم، وأعتقد أنه من الجيد أن يتم تطوير هذا البرنامج على الرغم من أنه يمكن أن يسلب الرسامين مصدر رزقهم وكرامتهم.
    يقوم كل شخص بتطوير مواهبه حسب البيئة التي نشأ فيها وفي بيئة يمكن فيها الرسم بشكل تلقائي، من الممكن أن يقوم بعض الرسامين بإظهار موهبتهم بطرق أخرى.
    إن إلزام العالم كله حتى يتم التعرف على الرسامين الموهوبين حتى لو لم تعد هناك حاجة لمواهبهم هو في رأيي أشبه بمنع تطوير وسائل النقل حفاظا على كرامة العدائين الموهوبين.

  3. توسط:
    جئت إلى موضوع الطب لأن المشكلة متشابهة، ومع أن الاعتبار الذي قدمته كان صحيحا في حد ذاته، فإنه كان سيقع في هذا السياق أيضا.
    ماذا بعد؟ فالنظر لا يصح لا في الصور ولا في الطب.

  4. مايكل، كيف بحق الجحيم دخلت الطب؟
    كنت أتحدث عن هذه الجملة ولا شيء غيرها.
    ""وهو متاح أيضًا لأولئك الذين يفتقرون إلى الموهبة والتدريب في الفنون البصرية""

    ونعم كلامك صحيح، البرنامج تم تطويره بغرض نقل أفكار مهمة جداً،
    سيساعد هذا بشكل أساسي محرري الصحف الشعبية.
    وكما قلت، لم أكن أتحدث حقًا عن هذه الحالة المحددة، ولكن في الغالب عن الثقافة.

  5. عميشاي:
    أنا لا أقول أنه لا ينبغي مناقشة هذه القضايا.
    أنا فقط أقول أنه لا ينبغي وضع قوانين تركز على قضايا ليس لدينا معلومات عنها.
    وكما ذكرنا، فإن كل ما كان المقصود من الرد هو الإشارة إلى التناقض في عبارة "المتوسطة".
    وفيما يتعلق بالموقف الذي يجب على العلماء صياغته بشأن المسائل الأخلاقية، فرغم أنني أعتقد حقًا أن الانخراط في العلم يجعل الإنسان أكثر أخلاقية (أو ربما العكس - فالأخلاق هي التي تدفع الإنسان إلى الانخراط في العلم)، فمن الواضح وأن هناك أيضًا استثناءات لهذه المسألة (بحسب هايزنبرغ).
    فالعلماء - في نهاية المطاف - هم أيضًا مواطنون، وعليهم، على هذا النحو، أن يعبروا عن آرائهم بشأن المسائل الأخلاقية.
    يُسمح لهم بارتداء قبعة العالم فقط عندما يتحدثون عن العلم، ومن الواضح أنه كجزء من مهنتهم يجب عليهم أن يسعوا جاهدين لاكتشاف البيانات الموضوعية والاعتبارات المنطقية التي قد تساعد في تحديد المسائل الأخلاقية.

    وحتى القنبلة الذرية -رغم كل ما هي مثال واضح لسؤال أخلاقي- فإنها تظل مثالا واضحا لسؤال ليس للعلم إجابة عنه، وإلى يومنا هذا هناك علماء على جانبي السياج.

  6. مايكل:
    لا أستطيع أن أتفق معك، لأنه من الأفضل لنا ألا نناقش قضايا الحياة والموت
    صحيح أن الموضوع على المستوى الفردي معقد للغاية، ويجب مناقشته بأقصى قدر من الحساسية، لكن على المستوى المبدئي من واجبنا أن نناقش كل المشاكل التي يطرحها التطور العلمي، خاصة عندما يكون له آثار على الحياة والحياة. معضلات الموت أو مستقبل الجنس البشري.
    وعندما لا يتخذ العلماء موقفا، تدخل في الموضوع أطراف أخرى، عادة من النوع الديني، الذين يحددون لنا الأحكام والقوانين حسب تقاليدهم القديمة، بكل خشونة ودون أي تدريب على الموضوع، دون أي صلة بالمصلحة. للفرد أو المجتمع . وأنا لا أقصد فقط رجال الدين اليهود.
    وبالتالي، فإن بعض الحاخامات لا يعترفون بالموت الدماغي، ونتيجة لذلك يعارضون التبرع بالأعضاء المنقذة للحياة.
    وهكذا تم حظر التجارب على الخلايا الجذعية الجنينية في الولايات المتحدة الأمريكية، تحت تأثير اللوبي الديني في إدارة بوش، ولم تلغي ميشيل أوباما الحظر إلا مؤخراً.
    أوقف عالم إيطالي قام بزراعة جنين بشري في المختبر التجربة بعد مناشدة قوية من البابا نفسه. ربما كان من الصواب إيقاف التجربة، لكن القرار كان يجب أن يكون اجتماعياً وعلمياً وليس دينياً!
    وينصح رجال الدين المتطرفون النساء الحوامل بعدم إجراء فحوصات الموجات فوق الصوتية، خشية اكتشاف عيوب في الجنين تقنع المرأة بالإجهاض. فقط في الأيام القليلة الماضية كان هناك نقاش حول هذه القضية بين حاخامين.
    عندما تذكر أينشتاين وهتلر في سياق الحياة والموت، فمن المناسب أن تذكرهما في سياق حياة وموت الكثير والكثير من الناس. ومن المعروف أن أينشتاين في ذلك الوقت امتنع عن التوصية بصنع القنبلة الذرية، ولم يرسل خطاب توصيته إلى الرئيس ترومان إلا بعد أن أقنعه أصدقاؤه بأن النازيين يحرزون تقدما في الأبحاث الذرية ويمكن أن يكونوا أول من فعل ذلك. خلق القنبلة.
    ومنذ ذلك الحين، أصبحت مسألة تصنيع القنبلة نموذجاً لمعضلة علمية أخلاقية، فهل يحق للعلماء أن يروجوا لأبحاثهم دون النظر إلى آثارها على البيئة والإنسانية، في حين أن القرار في الحقيقة متروك للعلماء؟ أيدي السياسيين، أم أن من واجبنا إنشاء هيئات عامة متفق عليها تناقش كل النتائج المترتبة على المعضلات العلمية الأخلاقية.
    ومن الجدير بالذكر أيضًا أن دراسة الجينوم البشري فتحت، وستفتح أمامنا، العديد من المعضلات الصعبة والعميقة.
    ما أريد أن أفهمه من كلامي هو أن أي مجال يمنع التقدميين والمستنيرين من دخوله، سوف تشغله قريبًا تلك العناصر التي لا نريد رؤيتها هناك.

  7. عميشاي:
    أنا على دراية تامة بالمشاكل التي فتحتها.
    بشكل عام، يعتمد التطور على تكيف الحيوان (وفي هذه الحالة - الإنسان) مع البيئة.
    ليس من المستغرب على الإطلاق أنه يحاول تغيير البيئة التي تناسبه.
    إذا كانت البيئة التي أنشأناها تسمح ببقاء المزيد من الناس على قيد الحياة - فكم هو جيد!
    ليس لدينا أبدًا ما يكفي من البيانات لنحسب بذكاء قيمة حياة هذا الشخص أو ذاك (ربما أينشتاين التالي؟ ولكن ربما، في الواقع، هتلر التالي؟).
    شعوري البديهي هو أنه من الجيد أن يكون هذا هو الحال وأننا لسنا مجهزين عقليًا للتعامل مع مسائل الحياة والموت لهذا الفرد أو ذاك من خلال الإحصائيات.
    على أية حال - ردي كان مكتوبًا بشكل أساسي لتوعية السيد "ميدوكريتي" بجوانب الحياة التي يتجاهلها اقتراحه على الرغم من أنها تشكل نفس المعضلة تمامًا.

  8. מיכאל
    إجابتك تسحب المناقشة إلى قنوات إضافية والإجابة على سؤالك الأول ليست واضحة بذاتها.
    يسمح الطب الحديث اليوم للعديد من الأشخاص الذين يعانون من خلل وراثي بالوصول إلى سن الإنجاب وإنتاج ذرية تحمل جميعها الجين وسيحتاج البعض أيضًا إلى خدمات طبية معقدة (عمليات جراحية) مرة أخرى للبقاء على قيد الحياة.
    أنا شخصياً أعرف عائلة، خلال الأجيال الثلاثة التي أعرفها، كان بعض الأطفال يخضعون لعملية جراحية معقدة في القلب في مرحلة الطفولة المبكرة لتصحيح التشوهات الشديدة مع الدوالي المختلفة.
    وإذا تجاهلنا الجانب الشخصي للحظة، نأتي إلى مسألة طبية فلسفية صعبة سبق أن كتب عنها في العديد من الكتب والمقالات مثل كتاب "لعنة الطب".
    وطبعا ليس هذا هو المكان المناسب لتطور الموضوع، لكنه يفتح بابا لمشكلات فلسفية أخلاقية صعبة تتعلق بالطب المتقدم وعلم الوراثة الثوري وحقوق الفرد مقابل مصلحة المجتمع.

  9. السيد المتوسط:
    نعم! أكمل من فضلك! لماذا في الواقع ننقذ من الموت المرضى الذين كانوا سيموتون "بشكل طبيعي"؟ لماذا نمنح المعاقين الوسائل للتغلب على إعاقتهم ولا نتركهم لمعاناتهم؟
    أنت ببساطة لا تفهم أن البيئة يجب أن تتغير وأن الإنسان - مثل أي حيوان آخر - يحاول تغييرها لصالحه.
    في بعض الأحيان يمكن أن يساعد الرسم التوضيحي في توضيح فكرة من شأنها تقدم البشرية، لكن صاحب الفكرة لا يعرف كيف يوضح ومن يعرف كيف يوضح لا يتجاوز الفكرة. أعتقد أنه من الأفضل في رأيك التخلي عن الفكرة (بقدر ما هي جيدة) فقط للحفاظ على مهنة الرسام.
    لو كان الأمر بيدك، لما كنا نشغل الآلات التي سرقت المهنة من البشر (الذين يعيشون الآن أفضل بكثير بفضل الآلات).
    إن ما يحدث لا يسمى اعتدالا بل مزيج قوى وما تقترحه لا يسمى امتيازا بل تثبيتا وركودا.

  10. آسف على التجاوز، ولكن تجاهل هذا السطر:
    وهو ليس في متناول أولئك الذين يحتاجون إلى الاعتراف بهم فقط بسبب موهبتهم.

    البناء = بينهما.

  11. الرد السابق جاء بالخطأ ولم يتجاوزه، ولكن المبدأ واضح.

    ما أريد قوله الآن هو أن الأشخاص غير الموهوبين لن يحصلوا على التقدير فقط [أحيانًا على حساب المواهب الحقيقية] ولكنهم سيحصلون أيضًا على التقدير.
    لم تعد يد الصدفة تسيطر علينا، نحن نغير كل شيء بأنفسنا، وهذه الطريقة لا تتوافق حقًا مع الرأسمالية، ناهيك عن اللاسلطوية، ولكن في الرأسمالية لا توجد عدالة حقًا، وبدلاً من ذلك نقص الموهبة -
    اسمح لهم بالبحث عن شيء يجيدونه وساعدهم ببساطة فيما يرونه مناسبًا، وستحصل على التكنولوجيا أيضًا.
    وهو ليس في متناول أولئك الذين يحتاجون إلى الاعتراف بهم فقط بسبب موهبتهم.

    أنا لا أتحدث بالضرورة عن حالة محددة لهذا البرنامج، ولكن عن أشياء كثيرة يخترعها العلم
    ويحفظ من الناس ما ليس لهم، ويهلك الذين لهم، إذ يشبه أبناءه إلى حد ما،
    ومرة أخرى، هذا لا يتماشى مع الرأسمالية.

  12. يمكن الوصول إليها حتى لأولئك الذين يفتقرون إلى الموهبة والتدريب في الفنون البصرية"

    نرجو أن يحمينا التطور، JK،
    مزيد من الرداءة، ببساطة رائعة، عظيمة، تكنولوجيا المهووسين بدون موهبة [وليس ذكاء].
    يبدأ الأمر بأشخاص لم يكن من المفترض أن يغنوا، ويقررون أن يصبحوا مغنيين، وبمساعدة التكنولوجيا والاستوديو المتقدم.
    صنع الأغاني,

  13. هل ينتهك البرنامج بعض حقوق النشر؟
    لا أريد أن تظهر الأغنام التي قمت بتصويرها في صور الآخرين….

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.