إن قدرة الروبوت المزود بعدة كاميرات على قياس المسافة التي تفصله عن الأشياء الموجودة في مجاله البصري، وبالتالي عمقها، من الصور التي يلتقطها، أمر ضروري لتوجيه تفاعلاته معها، سواء للإمساك بها أو تجنب الاصطدامات. وماذا عن نظيره البيولوجي؟
لقد أثبت المجسم، الذي اخترعه الفيزيائي تشارلز ويتستون في عام 1838، والذي يسمح بعرض صور لنفس المشهد المأخوذة من وجهات نظر مختلفة قليلاً بشكل منفصل لعيني الشخص، أن هذا الشخص لديه انطباع بأنه يرى “بارتياح” – وهذا أيضًا مبدأ السينما ثلاثية الأبعاد.
منذ نشأة الرؤية الاصطناعية، عمل الباحثون على تطوير أساليب قادرة على إعادة إنتاج هذه الظاهرة المعروفة باسم “التنظير المجسم ثنائي العينين” على جهاز كمبيوتر مزود بكاميرتين، لأنها تشمل كلتا العينين. تقوم مرحلة المطابقة أولاً بربط كل بكسل من الصورة الأولى مع بكسل الثاني الذي يتوافق مع نفس النقطة في المشهد. للقيام بذلك، نسعى إلى تحقيق أقصى قدر من التشابه (أو الارتباط) بين الألوان المقاسة في مناطق صغيرة تتمحور حول وحدات البكسل المرشحة مع الأخذ في الاعتبار أوجه الغموض التي لا مفر منها: بالنظر إلى صورتين لجدار من الطوب، أي الصورتين يجب مطابقتهما نظرًا لأنهما جميعًا تبدو متشابهة. يتم بعد ذلك استخدام المزيد من القيود العالمية، مثل استمرارية العمق بين وحدات البكسل المجاورة، لإزالة نقاط الغموض هذه.
تتيح خطوة التثليث الثانية حساب العمق: النقطة ثلاثية الأبعاد المرتبطة بـ…








