रिकाम्या ——- भरा आणि पूर्वग्रह शोधा!
By ऑनलाइन लोकमत | Published: June 18, 2022 06:42 AM2022-06-18T06:42:25+5:302022-06-18T06:43:21+5:30
तुटक रेषेच्या ठिकाणी तुम्ही ‘पिशव्या’, ‘खोल्या’, ‘गाड्या’.. असे शब्द भरू शकला असता; पण तुम्ही तिथे ‘जागा’ हाच शब्द भरला असणार, कारण?
- विश्राम ढोले
(माध्यम, तंत्रज्ञान, संस्कृती
या विषयांचे अभ्यासक)
विचित्र वाटलं नं लेखाचं शीर्षक? आहेच तसं ते. पण तरीही त्यात खोलवरचा अर्थ दडला आहे. कसा ते बघा.
तुमच्यापैकी बहुतेकांनी हे शीर्षक वाचताना मनातल्या मनात अभावितपणे त्या तुटक रेषेच्या (——) ठिकाणी ‘जागा’ हा शब्द भरूनही टाकला असणार आणि शीर्षक वाचलं असणार- ‘रिकाम्या जागा भरा आणि पूर्वग्रह शोधा.’
- खरं तर त्या तुटक रेषेच्या ठिकाणी तुम्ही ‘पिशव्या’, ‘खोल्या’, ‘वह्या’, ‘गाड्या’ असे बरेच शब्द भरू शकला असता. पण तुम्ही तिथे ‘जागा’ हाच शब्द भरला, याचं कारण आपल्याला लागलेली भाषिक सवय. शाळकरी वयापासून ‘रिकाम्या (किंवा गाळलेल्या) जागा भरा’ हे वाक्य इतकेवेळा वाचलेलं असतं, की आपली भाषिक बुद्धी ‘रिकाम्या’ आणि ‘भरा’ हे दोन शब्द एकत्र दिसले की लगेच त्यांची सांगड ‘जागा’ या शब्दाशी घालते. या दोन शब्दांसोबत कोणता तिसरा शब्द येईल असं विचारलं तर ९० टक्के लोक या प्रश्नाचं उत्तर ‘जागा’ हेच देतील. याचाच अर्थ, आपल्या भाषिक व्यवहारांमध्ये बरेचसे शब्द मित्रांसारखे सोबत वावरतात. अगदी एकमेकांचे हात धरून येतात. भाषिक व्यवहाराला शक्याशक्यतेच्या सांख्यिकी चाचण्या लावल्या तर एखाद्या शब्दाबरोबर दुसरा कोणता शब्द येईल याचं टक्केवारीत भाकितही वर्तविता येतं.
कृत्रिम बुद्धिमत्तेच्या साह्याने भाषिक व्यवहार समजून घेण्याच्या प्रवासातलं हे एक महत्त्वाचं पाऊल आहे. त्याची पद्धत तशी परिचयाची आहे. गहनमतीला प्रचंड विदा पुरवायची. इथे डिजिटाईज्ड झालेला भाषिक मजकूर द्यायचा. मग त्याला ज्याचा शोध घ्यायचा ती बाब सांगायची. त्याचं प्राथमिक गणिती सूत्र पुरवायचं त्यातून आलेल्या उत्तराच्या योग्यायोग्यतेबद्दल फिडबॅक द्यायचा आणि मग स्वतःत सुधारणा करून अधिकाधिक चांगलं उत्तर शोधण्याची जबाबदारी गहनमतीवर टाकून द्यायची.
शब्द त्यांच्यासारख्या अर्थाच्या आणि संदर्भाच्या शब्दांजवळपास सापडतात हे या शोधाचं गृहीतक. गहनमती ते अंतर संख्येमध्ये मोजते आणि एखाद्या बिंदुचं स्थान एक्स वाय अक्षांच्या अवकाशात निश्चित करावं तसं दिलेल्या विदेच्या संदर्भात शब्दांचं स्थान निश्चित करते.
एकदा शब्दांना असं संख्येचं रूप मिळालं की मग त्यांची बेरीज वजाबाकी करून नवं काही शोधणं सोपं होतं. अशा संख्येच्या रूपात व्यक्त झालेल्या शब्दांना गहनमतीच्या परिभाषेत व्हेक्टर म्हणतात. एकदा या व्हेक्टर्स प्रक्रियेचं नीट ट्रेनिंग झालं की गहनमती मग दिलेल्या भाषिक विदेतून जणू चमत्कार घडवते. रिकाम्या जागा तर अचूकपणे भरतेच; पण भाषिक विदेतल्या अनेक अंतस्थ वृत्ती प्रवृत्तीही सांगायला लागते. तुम्ही फक्त योग्य प्रश्न विचारायला हवा.
उदाहरणार्थ, ‘महाराष्ट्र’ आणि ‘मुंबई’ या शब्दांमधील अंतस्थ नातं गहनमतीला कळलं तर आपण तिला एक गणिती प्रश्न विचारू शकतो. तो असा: “ महाराष्ट्र – (उणे) मुंबई कर्नाटक ” चं उत्तर काय. गहनमती बरोब्बर उत्तर देईल-
बंगळुरू. खरं तर गहमनतीला महाराष्ट्र हे एक राज्य आहे. त्याची राजधानी मुंबई आहे वगैरे काही माहीत नाही. पण त्यांच्यातलं व्हेक्टर अंतर नक्की माहीत आहे. तेच सूत्र मग ती कर्नाटकला लावते आणि त्यातून बंगळुरू असं बरोब्बर उत्तर देते. असाच प्रश्न तुम्ही भारत चलन विचारला तर उत्तर बरोबर रुपया असं मिळतं.
अशा पद्धतीने दिलेल्या भाषिक नातेसंबंधांतून योग्य शब्दाने रिकाम्या जागा भरणे याला कृत्रिम बुद्धिमत्तेच्या आणि डिजिटल सुविधांच्या क्षेत्रात महत्त्व आहे. शब्दांचं भाकित करण्याच्या (प्रेडिक्टिव्ह टेक्स्ट) या तंत्राचा वापर गुगल सर्च मध्ये मोठ्या प्रमाणावर होत असतो. सर्च करण्यासाठी तुम्ही दोन शब्द टाईप करीत नाही तर गुगल तुम्हाला उरलेली अख्खी ओळ किंवा तशा प्रकारच्या इतर ओळी सुचवतं. जीमेलवर इमेल लिहिताना तुम्ही लेट मी नो असं टाईप केलं की गुगल तुम्हाला इफ यु हॅव एनी क्वेश्चन असं सुचवतं. ही सारी या शब्द भाकित तंत्राची करामत.
जिथे मोठ्या प्रमाणावर भाषिक आशय वाचून त्यातून काही व्यवस्था लावायची असते तिथे हे तंत्र फार उपयोगी पडतं. उदाहरणार्थ नोकरीसाठी आलेल्या हजारो बायोडेटामधून सर्वोत्तम असे अर्ज काढायचे तर या तंत्राचा उत्तम वापर करता येतो. याच वर्ड व्हेक्टर तंत्राचा वापर करून साहित्य, कायदेविषयक कागदपत्रं, सामाजिक लेखन यांच्याशी संबंधित प्रचंड विदेचे विश्लेषण करणारी, त्यातून इतिहासातील खोलवरचे बदल टिपणारी एक नवी विद्याशाखाच उदयाला येत आहे. डिजिटल ह्युमॅनिटीज हे तिचं नाव.
पण या तंत्रामध्ये आणखी एक विलक्षण क्षमता आहे आणि एक धोकाही आहे. हे तंत्र फक्त रिकाम्या जागाच भरू शकतं असं नाही तर आपल्या भाषिक व्यवहारातील पूर्वग्रहांच्या, पठडीबाज विचारांच्या आणि गैरसमजांच्या सुप्त जागाही शोधून काढू शकतं. हे तंत्र वापरताना नीट काळजी घेतली नाही तर तेच चुकीचे पूर्वग्रह, पठड्या आणि गैरसमज अधिक पक्केही करू शकतं. लेखाच्या शीर्षकाचा उत्तरार्ध हीच शक्यता वर्तवितो. विचित्र वाटणाऱ्या शीर्षकाचा हा खोलवरचा अर्थ आहे. पण आपले पूर्वग्रह या तंत्रामध्ये कसे उमटतात, किंवा हे तंत्र ते कसे उघड करून दाखवतं, हे प्रश्न उरतात. त्यांची उत्तरं पुढच्या लेखात.