1. कंटेंट पर जाएं
  2. मेन्यू पर जाएं
  3. डीडब्ल्यू की अन्य साइट देखें

बेहतर अनुवाद के लिए रिसर्चर कर रहे हैं गणित का इस्तेमाल

१४ अक्टूबर २०१९

अनुवाद के मशीनी साधन बनाने वाले किसी विदेशी भाषा को समझाने के लिए आज भी अधिकतर डिक्शनरियों पर निर्भर रहते हैं. लेकिन अब अंक के रूप में एक नया तरीका सामने आ रहा है.

https://p.dw.com/p/3RG6B
Symbolbild Computer Hardware Glasfaser
तस्वीर: Imago/Science Photo Library

फेसबुक के शोधकर्ताओं का कहना है कि शब्दों को अंकों में बदलना और भाषाओं के बीच की गणितीय समानताओं का इस्तेमाल करना एक आशाजनक तरीका है, भले ही स्टार ट्रेक के जैसा एक यूनिवर्सल कम्यूनिकेटर अभी एक सपना ही क्यों न हो. अच्छा ऑटोमेटिक अनुवाद इंटरनेट की बड़ी कंपनियों के लिए एक बड़ी प्राथमिकता है. दुनिया भर के लोगों को एक दूसरे से संवाद स्थापित करने में मदद करना सिर्फ एक परोपकारी लक्ष्य नहीं है, बल्कि ये व्यापार के लिए भी लाभकारी है. 

फेसबुक, गूगल, माइक्रोसॉफ्ट, रूस की यांडेक्स, चीन की बाइदू और उनके जैसी अन्य कंपनियां अपने अनुवाद के साधनों को और बेहतर बनाने की कोशिशें निरंतर कर रही हैं. पेरिस में फेसबुक की कई प्रयोगशालाओं में से एक में आर्टिफिशियल इंटेलिजेंस के विशेषज्ञ इस पर काम कर रहे हैं. फेसबुक में फंडामेंटल एआई रिसर्च की यूरोपीय सह-निदेशक आंत्वान बोर्डेस ने बताया कि इस वक्त फेसबुक पर 200 भाषाओं का इस्तेमाल हो रहा है. मौजूदा समय मेंऑटोमेटिक अनुवाद का आधार है किन्ही दो भाषाओं में एक जैसे दिखनेवाले टेक्स्ट के बड़े बड़े कोष. लेकिन कई भाषाओं के जोड़ों के साथ समस्या ये है कि उनके बीच उतने समानांतर टेक्स्ट हैं नहीं जितनों की आवश्यकता है. इसीलिए शोधकर्ता लम्बे समय से अन्य तरीकों की तलाश में हैं और इन्हीं में एक तरीका है फेसबुक द्वारा बनाई गई एक प्रणाली जो शब्दों का एक गणितीय प्रतिरूप बनाती है.

हर शब्द सैंकड़ों आयामों के बीच एक "वेक्टर"यानी एक निश्चित मात्रा वाली राशि, बन जाता है. बोली हुई भाषा में जो शब्द एक दूसरे के करीब हैं, इस वेक्टरों की दुनिया में भी खुद को एक दूसरे के निकट पाते हैं. इस प्रणाली को बनाने वालों में से एक गिलोम लाम्प्ल, कहते हैं, "मिसाल के तौर पर, अगर आप "कुत्ता" और "बिल्ली" जैसे शब्दों को लें, तो आप पाएंगे कि वेक्टर के रूप में ये दोनों शब्द एक दूसरे के बहुत करीब होंगे क्योंकि ये दोनों मिलती जुलती चीजों का विवरण देते हैं. अगर आप मेड्रिड, लंदन, पेरिस जैसे नामों को ले लें जो सभी यूरोपीय राजधानियों के नाम हैं, यहां भी वही बात होगी".

Fast nur Lehrerinnen an Grundschulen
तस्वीर: picture-alliance/dpa/J. Stratenschulte

फिर इन भाषाई नक्शों को अल्गोरिदम की मदद से एक दूसरे से जोड़ा जा सकता है. ये प्रक्रिया शुरू में तो प्राथमिक ही रह पाएगी पर इसे धीरे धीरे तब तक बारीक किया जा सकता है जब तक पूरे के पूरे वाक्य को बिना ज्यादा गलतियों के मिलाया जा सके. लाम्प्ल ने बताया कि अभी से जो नतीजे आ रहे हैं वो आशाजनक हैं. उन्होने जानकारी दी कि अंग्रेजी और रोमानियाई भाषाओं के जोड़े के लिए, फेसबुक की अभी की मशीनी अनुवाद प्रणाली या तो शब्द वेक्टर प्रणाली के जितनी ही कारगर है या उस से बस थोड़ा सी खराब. लेकिन अंग्रेजी-उर्दू जैसे ज्यादा दुर्लभ भाषाई जोड़े के लिए शब्द वेक्टर प्रणाली अभी से श्रेष्ठतर है, क्यूंकि फेसबुक की पारंपरिक प्रणाली में इन भाषाओं के ज्यादा समानांतर टेक्स्ट नहीं हैं.

पर क्या इस नए तरीके से और भी भाषाओं के बीच काम करना संभव है, जैसे, मान लीजिये बास्क को अमेजॉन के किसी कबीले की भाषा में अनुवाद करना? लाम्प्ल कहते हैं कि सैद्धांतिक तौर पर ये संभव है, लेकिन व्यावहारिक तौर पर इसके लिए बड़ी मात्रा में लिखित टेक्स्ट की आवश्यकता होगी, जो कि अमेजॉन की कबीलाई भाषाओं में नहीं मिलेंगे. "सिर्फ सैंकड़ों वाक्यों से काम नहीं चलेगा, लाखों, करोड़ों वाक्यों की जरूरत पड़ेगी".

फ्रांस के सीएनआरएस राष्ट्रीय वैज्ञानिक केंद्र के विशेषज्ञ कहते हैं कि लाम्प्ल ने फेसबुक के लिए जो तरीका अपनाया है उससे उपयोगी नतीजे निकल सकते हैं, चाहे उससे परिपूर्ण अनुवाद हो या न हो. सीएनआरएस की लैटिस प्रयोगशाला के थियेरी पोबो ने शब्द वेक्टर प्रणाली को एक "वैचारिक क्रांति" बताया. उन्होंने कहा की बिना समानांतर डाटा के अनुवाद करना एक तरह से मशीनी अनुवाद के होली ग्रेल जैसा है. "लेकिन सवाल ये है कि इस तरीके से किस स्तर के प्रदर्शन की उम्मीद की जा सकती है", पोबो ने कहा. ये तरीका मूल टेक्स्ट का एक अंदाजा तो दे सकता है, लेकिन ये हर बार एक अच्छा अनुवाद देगा ये अभी साबित नहीं हो पाया है.

सीएनआरएस की ही कंप्यूटर विज्ञान प्रयोगशाला में कार्यरत शोधकर्त्ता फ्रांसोवा य्वों का कहना है, "जब दो भाषाएँ एक दूसरे से बहुत भिन्न होती हैं तो उन्हें जोड़ना कहीं ज्यादा मुश्किल होता है".उन्होंने कहा, "चीनी भाषा में सिद्धांतों को बतलाने का तरीका फ्रेंच से बिलकुल अलग है." लेकिन य्वों ने ये जरूर कहा कि अधूरा अनुवाद भी उपयोगी सिद्ध हो सकता है और नफरत फैलाने वाले भाषणों जैसी चीजों का पता लगाने में पर्याप्त साबित हो सकता है, जो फेसबुक के लिए एक बड़ी प्राथमिकता है.

केसी/एमजे (एएफपी)

__________________________

हमसे जुड़ें: WhatsApp | Facebook | Twitter | YouTube | GooglePlay | AppStore

ये हैं टॉप 10 'डेंग्लिश' शब्द