भाषा चुनें

द्वि-आयामी लेजर रेंजफाइंडर और कैमरे के बीच बाहरी पैरामीटर कैलिब्रेशन: एक नवीन विश्लेषणात्मक विधि

V-आकार के कैलिब्रेशन टार्गेट और पॉइंट-टू-प्लेन बाधा का उपयोग करके 2D लेज़र रेंजफाइंडर और कैमरे के बाहरी पैरामीटर कैलिब्रेशन के लिए एक नई विधि प्रस्तावित की गई है, जो एक स्पष्ट विश्लेषणात्मक समाधान प्रदान करती है।
reflex-sight.com | PDF Size: 4.2 MB
रेटिंग: 4.5/5
आपकी रेटिंग
आपने इस दस्तावेज़ को पहले ही रेट कर दिया है
PDF दस्तावेज़ कवर - 2D लेज़र रेंजफाइंडर और कैमरे के बीच बाह्य पैरामीटर कैलिब्रेशन: एक नवीन विश्लेषणात्मक विधि

सामग्री सूची

1. परिचय

रोबोटिक्स और स्वायत्त प्रणालियाँ बहु-संवेदक संलयन पर बढ़ती निर्भरता दिखा रही हैं, विशेष रूप से कैमरे के दृश्य डेटा को लेजर रेंज फाइंडर (LRF) के सटीक ज्यामितीय डेटा के साथ जोड़कर। द्वि-आयामी LRF अपनी लागत-प्रभावशीलता और समतल स्कैनिंग क्षमता के कारण व्यापक रूप से उपयोग किए जाते हैं। हालाँकि, उनके डेटा को कैमरा छवियों के साथ संयोजित करने के लिए, उनके बीच के सापेक्ष पोज़ का सटीक ज्ञान आवश्यक है - इसे बाह्य पैरामीटर कैलिब्रेशन समस्या के रूप में जाना जाता है। यह लेख उस मूल चुनौती का समाधान प्रस्तुत करता है जब लेजर बीम कैमरे परअदृश्यजब द्वि-आयामी LRF और एक मानक कैमरे का अंशांकन किया जाता है, तो यह प्रत्यक्ष पत्राचार स्थापित करना असंभव बना देता है। पूर्व के तरीकों को या तो व्यापक अवलोकन की आवश्यकता होती है, या उनमें अंतर्निहित अस्पष्टता होती है, या वे एक अच्छे प्रारंभिक अनुमान पर निर्भर करते हैं। यह पत्र एक नवीन, न्यूनतम और अस्पष्टता-मुक्त विश्लेषणात्मक समाधान प्रस्तावित करता है।

2. कार्यप्रणाली

2.1 कैलिब्रेशन टार्गेट और सिस्टम सेटअप

प्रस्तावित प्रणाली एक कस्टमाइज्ड V-आकार के कैलिब्रेशन टार्गेट का उपयोग करती है, जो दो गैर-कोप्लानर त्रिकोणीय समतलों से बना है, जिनमें से प्रत्येक पर चेसबोर्ड पैटर्न लगा हुआ है। इस टार्गेट को एक स्टैंड पर लगे द्वि-आयामी LRF और एक कैमरे द्वारा एक साथ देखा जाता है। LRF का स्कैनिंग प्लेन दोनों त्रिकोणीय समतलों के साथ प्रतिच्छेद करता है, जिससे दो रेखा खंड उत्पन्न होते हैं। चेसबोर्ड के कोने बिंदु कैमरा छवि में पहचाने जाते हैं, जिससे कैमरा कोऑर्डिनेट सिस्टम में इन समतलों को परिभाषित किया जाता है।

2.2 पॉइंट-प्लेन कंस्ट्रेंट

उपयोग की गई मूलभूत ज्यामितीय बाधा हैबिंदु-तलदूरी। LRF द्वारा मापे गए त्रि-आयामी बिंदु $\mathbf{P}_l$ (LRF समन्वय प्रणाली में) को अज्ञात बाह्य मापदंडों (घूर्णन $\mathbf{R}$ और स्थानांतरण $\mathbf{t}$) के माध्यम से कैमरा समन्वय प्रणाली में रूपांतरित किया जाता है: $\mathbf{P}_c = \mathbf{R} \mathbf{P}_l + \mathbf{t}$। यह बिंदु कैमरा द्वारा प्रेक्षित संबंधित अंशांकन तल पर स्थित होना चाहिए। यदि तल को उसके सामान्य सदिश $\mathbf{n}_c$ और उस पर स्थित एक बिंदु $\mathbf{Q}_c$ द्वारा परिभाषित किया जाता है, तो बाधा है: $\mathbf{n}_c^T (\mathbf{P}_c - \mathbf{Q}_c) = 0$।

2.3 विश्लेषणात्मक हल व्युत्पत्ति

लेखक ने सिद्ध किया कि V-आकार के लक्ष्य के लिएएकल अवलोकनयह 6-DOF बाह्य पैरामीटरों को विशिष्ट रूप से हल करने के लिए पर्याप्त बाधाएं प्रदान कर सकता है। दो गैर-समतलीय तलों से आने वाले दो प्रतिच्छेदी रेखा खंडों से बाधाएं स्थापित करके, उन्होंने समीकरणों की एक प्रणाली प्राप्त की। मुख्य बिंदु यह है कि उन्होंने सिद्ध किया कि समान बाधाओं पर आधारित पिछली विधियां अस्पष्ट समाधान (उदाहरण के लिए, समाधान स्थितखतरनाक सिलेंडरपर) उत्पन्न करती हैं, जबकि उनका सूत्र V-आकार के लक्ष्य की गैर-समतलीय ज्यामितीय विशेषताओं का उचित उपयोग करके एक विशिष्ट समाधान प्राप्त करता है। अंतिम परिणाम एक विश्लेषणात्मक, बंद-रूप समाधान है जिसके लिए पुनरावृत्ति अनुकूलन या प्रारंभिक अनुमान की आवश्यकता नहीं है।

3. तकनीकी विवरण एवं गणितीय सूत्र

मूल गणितीय समस्या $\mathbf{R} \in SO(3)$ और $\mathbf{t} \in \mathbb{R}^3$ को हल करना है। समतल $\Pi_j$ पर स्थित लेजर बिंदु $\mathbf{p}_l^i$ के लिए, जिस समतल का अभिलंब सदिश $\mathbf{n}_c^j$ है और जिस पर एक बिंदु $\mathbf{q}_c^j$ है, बिंदु-समतल बाधा देती है:

4. प्रयोगात्मक परिणाम एवं विश्लेषण

4.1 सिमुलेशन प्रयोग

नियंत्रित शोर के तहत सिमुलेशन परीक्षण किए गए। प्रस्तावित विधि की तुलना अत्याधुनिक तकनीकों [5], [7] से की गई। मूल्यांकन मापदंडों में रोटेशन और अनुवाद त्रुटियाँ शामिल थीं। परिणाम लगातार दर्शाते हैं कि नई विधि:

4.2 वास्तविक दुनिया प्रयोग

इस पद्धति को Hokuyo UTM-30LX LRF और एक स्टीरियो कैमरा जोड़ी (जिसमें से एक कैमरे का उपयोग कैलिब्रेशन के लिए किया गया) के साथ एक भौतिक सेटअप में सत्यापित किया गया। V-आकार का लक्ष्य दो त्रिकोणीय प्लेटों से बना था। अनुमानित मापदंडों का उपयोग करके LRF बिंदुओं को कैमरा छवि पर प्रक्षेपित करके और ज्ञात कैलिब्रेशन पैटर्न के सापेक्ष पुनःप्रक्षेपण त्रुटि को मापकर कैलिब्रेशन सटीकता का मूल्यांकन किया गया। बिंदु-रेखा बाधाओं और अधिक अवलोकनों पर निर्भर साहित्य [10] की पद्धति की तुलना में, इस पद्धति ने व्यावहारिक व्यवहार्यता और उच्चतर सटीकता प्रदर्शित की।

मुख्य अंतर्दृष्टि

  • न्यूनतम समाधान: V-आकार के लक्ष्य की एकल स्नैपशॉट पूर्ण 6-डिग्री-ऑफ-फ्रीडम कैलिब्रेशन के लिए पर्याप्त है, जिससे डेटा संग्रह का कार्यभार कम हो जाता है।
  • अस्पष्टता समाप्ति: कैलिब्रेशन टार्गेट की नॉन-कोप्लानर डिज़ाइन पिछली प्लानर टार्गेट-आधारित विधियों में निहित स्थानिक अस्पष्टता को दूर करने की मुख्य कुंजी है।
  • प्रारंभिक अनुमान की आवश्यकता नहीं: विश्लेषणात्मक प्रकृति पुनरावृत्तिमूलक अरेखीय अनुकूलन और उससे संबंधित अभिसरण समस्याओं की आवश्यकता से बचाती है।

5. विश्लेषणात्मक ढांचा: मुख्य अंतर्दृष्टि और तार्किक संरचना

मुख्य अंतर्दृष्टि: इस लेख की सफलता केवल एक और कैलिब्रेशन एल्गोरिदम नहीं है; यह एक ज्यामितीयस्पष्टीकरण। इसने व्यापक रूप से अपनाए गए द्वि-आयामी LRF-कैमरा कैलिब्रेशन बिंदु-समतल बाधा मॉडल में एक मौलिक दोष - अस्पष्टता - की पहचान की और उसे सटीक रूप से सुधारा। जबकि इस क्षेत्र ने अधिक डेटा (दसियों छवियों) या जटिल ऑप्टिमाइज़र जोड़कर इस दोष से बचने का रास्ता अपनाया, लेखक मूल कारण तक गए: एक समतल लक्ष्य का उपयोग करते समय, बाधा मॉडल स्वयं अपर्याप्त रूप से बाधित है। उनका V-आकार लक्ष्य, समस्या को अच्छी तरह से पोज़ (गैर-समतलीय समतल) करने के लिए आवश्यक गणितीय शर्त का एक सरल भौतिक उदाहरण है। यह स्ट्रक्चर फ्रॉम मोशन में अंतर्दृष्टि की याद दिलाता है, जहाँ स्थिर समाधान प्राप्त करने के लिए अवनत विन्यासों (जैसे समतलीय बिंदुओं) से बचना चाहिए।

तार्किक प्रवाह: तर्क बहुत सुंदर ढंग से बनाया गया है: 1) समस्या को परिभाषित करना और इस बात पर जोर देना कि लेजर बीम का अदृश्य होना मुख्य चुनौती है। 2) मौजूदा तरीकों की समीक्षा करना और उनकी विशिष्ट विफलता के तरीकों (अस्पष्टता, कई दृष्टिकोणों की आवश्यकता) को इंगित करना। 3) V-आकार के लक्ष्य को एक महत्वपूर्ण एनाबलर के रूप में पेश करना, जो आवश्यक गैर-कोप्लानर बाधा प्रदान करता है। 4) सिद्ध करेंविशिष्टता - यह इंजीनियरिंग शोध पत्रों के लिए महत्वपूर्ण है लेकिन अक्सर अनदेखी की जाती है। 5) विश्लेषणात्मक समाधान प्राप्त करना, यह दिखाते हुए कि यह एक अच्छी तरह से तैयार की गई समस्या से स्वाभाविक रूप से उत्पन्न होता है। 6) सिमुलेशन (नियंत्रित) और वास्तविक (शोरयुक्त) प्रयोगों के माध्यम से सत्यापन। प्रवाह समस्या की पहचान से लेकर सैद्धांतिक समाधान तक, और फिर व्यावहारिक सत्यापन तक है।

6. लाभ, कमियाँ और व्यावहारिक अंतर्दृष्टि

लाभ:

  1. सैद्धांतिक कठोरता: विशिष्टता का प्रमाण इसे अनुमानी या शुद्ध रूप से अनुकूलन-आधारित विधियों से अलग करता है। यह गारंटी प्रदान करता है।
  2. व्यावहारिक दक्षता: एकल अवलोकन अंशांकन रोबोट इंजीनियरों के लिए फ़ील्ड तैनाती को काफी सरल बनाता है और सेटअप समय को कम करता है।
  3. मजबूती: अस्पष्ट कॉन्फ़िगरेशन के प्रति प्रतिरक्षा इसे विभिन्न वातावरणों में अधिक विश्वसनीय बनाती है।

दोष और सीमाएँ:

  1. कैलिब्रेशन टार्गेट पर निर्भरता: यह विधि लक्ष्य-मुक्त नहीं है। एक ज्ञात ज्यामिति वाले सटीक V-आकार के लक्ष्य का निर्माण और रखरखाव लागत बढ़ाता है। यह कुछ हालिया गहन शिक्षण विधियों द्वारा अपेक्षित "किसी भी वस्तु को पकड़ने" वाले अंशांकन की तरह नहीं है।
  2. पूर्ण पहचान धारणा: विश्लेषणात्मक समाधान लेजर रेखा और समतल किनारे के प्रतिच्छेदन बिंदु तथा शतरंज बोर्ड कोने बिंदुओं के पहचान त्रुटियों के प्रति संवेदनशील है। शोध पत्र ने गैर-रैखिक अनुकूलन के माध्यम से परिष्करण किया है, लेकिन शोर के प्रारंभिक विश्लेषणात्मक समाधान की संवेदनशीलता एक बाधा हो सकती है।
  3. द्वि-आयामी LRF तक सीमित: यह विधि विशेष रूप से द्वि-आयामी परिदृश्यों के लिए डिज़ाइन की गई है। किफायती त्रि-आयामी लिडार (जैसे Velodyne Puck, Livox) के उदय ने इसकी प्रत्यक्ष प्रयोज्यता को सीमित कर दिया है, हालांकि इसका मूल ज्यामितीय सिद्धांत प्रेरक है।

व्यवसायी और शोधकर्ताओं के लिए व्यावहारिक अंतर्दृष्टि:

  1. कार्यान्वयनकर्ताओं के लिए: इस पद्धति को द्वि-आयामी LRF-कैमरा अंशांकन के लिए एक आधार रेखा के रूप में उपयोग करें। इसकी गति और विश्वसनीयता अंशांकन लक्ष्य बनाने की मामूली परेशानी से कहीं अधिक है। अपनाने को बढ़ावा देने के लिए ओपन-सोर्स अंशांकन लक्ष्य का CAD मॉडल उपलब्ध है।
  2. शोधकर्ताओं के लिए: "अस्पष्टता पहचान और समाधान" टेम्पलेट बहुत मूल्यवान है। अन्य सेंसर फ्यूज़न समस्याओं (जैसे IMU-कैमरा, इवेंट कैमरा-LRF) में समान अंडरकंस्ट्रेन्ड मॉडल खोजें। क्या सूक्ष्म भौतिक सेटअप या बाधा पुनर्गठन के माध्यम से विश्लेषणात्मक समाधान उत्पन्न किया जा सकता है?
  3. अगला कदम — हाइब्रिड दृष्टिकोण: इस पद्धति की मजबूती को डेटा-संचालित तकनीकों के साथ एकीकृत करें। विश्लेषणात्मक समाधान का उपयोग करके परफेक्ट सिंथेटिक ट्रेनिंग डेटा जनरेट करें, ताकि न्यूरल नेटवर्क को कच्चे सेंसर डेटा से कैलिब्रेशन सीखने के लिए प्रशिक्षित किया जा सके, जिससे अंततः टार्गेटलेस कैलिब्रेशन की ओर बढ़ते हुए मजबूती बनाए रखी जा सके।

7. भविष्य के अनुप्रयोग और दिशाएँ

रोबोटिक्स उद्योग के लिए मजबूत और सरल बाह्य पैरामीटर कैलिब्रेशन के व्यापक प्रभाव हैं:

8. संदर्भ

  1. Thrun, S., Burgard, W., & Fox, D. (2005). प्रोबेबिलिस्टिक रोबोटिक्स. MIT Press.
  2. Geiger, A., Moosmann, F., Car, Ö., & Schuster, B. (2012). Automatic camera and range sensor calibration using a single shot. IEEE International Conference on Robotics and Automation (ICRA).
  3. Pusztai, Z., & Hajder, L. (2017). Accurate calibration of multi-LiDAR-multi-camera systems. Sensors.
  4. Lepetit, V., Moreno-Noguer, F., & Fua, P. (2009). EPnP: An Accurate O(n) Solution to the PnP Problem. International Journal of Computer Vision.
  5. Zhang, Q., & Pless, R. (2004). Extrinsic calibration of a camera and laser range finder. IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS).
  6. Vasconcelos, F., Barreto, J. P., & Nunes, U. (2010). A minimal solution for the extrinsic calibration of a camera and a laser-rangefinder. IEEE Transactions on Pattern Analysis and Machine Intelligence.
  7. Zhou, L. (2014). तीन समतल-रेखा अनुरूपताओं का उपयोग करके एक 2D LIDAR और एक कैमरा के बाह्य कैलिब्रेशन के लिए एक नया न्यूनतम समाधान। IEEE Sensors Journal.
  8. Kassir, A., & Peynot, T. (2010). Reliable automatic camera-laser calibration. Proceedings of the Australasian Conference on Robotics and Automation.
  9. Li, G., Liu, Y., Dong, L., Cai, X., & Zhou, D. (2010). An algorithm for extrinsic parameters calibration of a camera and a laser rangefinder based on line features. IEEE International Conference on Robotics and Biomimetics (ROBIO).
  10. Dong, W., & Isler, V. (2018). A novel method for the extrinsic calibration of a 2D laser rangefinder and a camera. IEEE Transactions on Instrumentation and Measurement. (This article).

Original Analysis (Industry Analyst Perspective):

Dong और Isler का यह पेपर सेंसर कैलिब्रेशन के क्षेत्र में एक संकीर्ण परंतु महत्वपूर्ण प्रगति का प्रतिनिधित्व करता है - कैलिब्रेशन वास्तविक दुनिया में रोबोटिक्स तैनाती की एक महत्वपूर्ण पर अक्सर कम आंकी जाने वाली बाधा है। कैलिब्रेशन समस्या रोबोटिक धारणा की "पाइपलाइन इंजीनियरिंग" है; यदि पाइपलाइनें संरेखित नहीं हैं, तो संयुक्त डेटा कचरा है। लेखकों का योगदान एक रिसते हुए जटिल मैनिफोल्ड को एक सुव्यवस्थित एकल कनेक्टर से बदलने के समान है। उनकी मुख्य उपलब्धि एक अ-सुसंगत अनुकूलन समस्या (जो स्थानीय मिनीमा के प्रति संवेदनशील और सावधानीपूर्वक आरंभीकरण की मांग करती है, जैसा कि कई दृश्य कार्यों सहित प्रारंभिक बंडल एडजस्टमेंट में देखा गया है) को एक सुसंगत बीजगणितीय समस्या में बदलना है। यह परिवर्तन, पुनरावृत्त अनुकूलन से प्रत्यक्ष गणना की ओर, विश्वसनीयता और गति के लिए गहन है।

अन्य धारणा क्षेत्रों में विकास के साथ इसकी तुलना करना शिक्षाप्रद है। दृश्य SLAM में, फ़िल्टर-आधारित तरीकों से अनुकूलन-आधारित तरीकों (जैसे ORB-SLAM) की ओर बदलाव ने सटीकता लाई, लेकिन जटिलता की कीमत पर। यहाँ, दिशा विपरीत है - जटिल बहु-दृश्य अनुकूलन से एकल-दृश्य विश्लेषणात्मक समाधान की ओर - और सटीकता का त्याग किए बिना। यह संभव है क्योंकि उन्होंने एक मजबूत पूर्व ज्ञान (ज्ञात V-आकार लक्ष्य ज्यामिति) पेश किया, ठीक वैसे ही जैसे AR मार्कर मुद्रा अनुमान को सरल बनाते हैं। इसका समझौता सामान्यता के बदले मजबूती और गति प्राप्त करना है, एक समझौता जो औद्योगिक अनुप्रयोगों में अक्सर सही साबित होता है।

जैसा कि पहले कहा गया है, पेपर की कमजोरी कस्टम लक्ष्यों पर इसकी निर्भरता में निहित है। एक ऐसे युग में जो अनुपयोगी और स्व-अनुपयोगी शिक्षण की ओर बढ़ रहा है -CycleGANजैसे कि CycleGAN जैसी सफलताओं द्वारा प्रतिनिधित्व किया गया है, जो बिना जोड़े डेटा के मैपिंग सीख सकते हैं - यह कुछ पारंपरिक लग सकता है। हालांकि, केवल इस आधार पर इसे खारिज करना एक गलती होगी। रोबोटिक्स उद्योग, विशेष रूप से लॉजिस्टिक्स और विनिर्माण में, संरचित वातावरण में संचालित होता है, जहां कैलिब्रेशन टारगेट का उपयोग पूरी तरह से स्वीकार्य है और आमतौर पर प्रमाणन-स्तरीय सटीकता और सुरक्षा प्राप्त करने के लिए बेहतर विकल्प है। इस पद्धति का मूल्य इसकी धारणाओं के दायरे में है।गारंटीसटीकता, यह वह गुण है जो डेटा-संचालित दृष्टिकोण अभी भी प्रदान करने में कठिनाई रखते हैं। जैसा किCarnegie Mellon University Robotics Instituteजैसे संस्थानों के शोध से अक्सर जोर दिया जाता है, तैनात प्रणालियों के लिए, मजबूती और पूर्वानुमेयता महत्वपूर्ण हैं।

भविष्य की ओर देखते हुए, सबसे आशाजनक मार्ग संकर दृष्टिकोण है। यह विश्लेषणात्मक विधि लक्ष्य-रहित अंशांकन के लिए मजबूत तंत्रिका नेटवर्क को प्रशिक्षित करने हेतु आवश्यक "ग्राउंड ट्रुथ" उत्पन्न करने की क्षमता प्रदान करती है, जिससे सिमुलेशन-से-वास्तविकता के अंतर को हल किया जाता है। यह एक आदर्श उदाहरण है जो दर्शाता है कि क्लासिकल ज्यामितीय कंप्यूटर विजन को डीप लर्निंग द्वारा प्रतिस्थापित नहीं किया गया है, बल्कि यह मूलभूत सिद्धांत और विश्वसनीय डेटा प्रदान करता है, जिससे डीप लर्निंग रोबोटिक्स में प्रभावी और सुरक्षित रूप से कार्य कर सके। किसी भी टीम के लिए जो द्वि-आयामी LRF-कैमरा प्रणाली तैनात कर रही है, यह शोध पत्र पहला पड़ाव होना चाहिए, न केवल इसके एल्गोरिदम के कारण, बल्कि समस्या की ज्यामितीय प्रकृति की स्पष्ट व्याख्या के कारण भी।