मुंबई विद्यापीठात मराठी भाषेचा कॉर्पस उपयोजित मानसशास्त्र विभागाचा उपक्रम
By रेश्मा शिवडेकर | Published: February 28, 2024 05:53 PM2024-02-28T17:53:03+5:302024-02-28T17:54:26+5:30
मुंबई विद्यापीठातील उपयोजित मानसशास्त्र विभागाने मराठी भाषेचे कॉर्पस विकसीत केले आहे.
रेश्मा शिवडेकर, मुंबई :मुंबईविद्यापीठातील उपयोजित मानसशास्त्र विभागाने मराठी भाषेचे कॉर्पस विकसीत केले आहे. मराठी भाषा गौरव दिनाचे औचित्य साधून उपयोजित मानसशास्त्र विभागातील प्राध्यापक डॉ. विवेक बेल्हेकर आणि त्यांच्या संशोधन चमूने संस्कृती, भाषा आणि व्यक्तिमत्व या विषयावर संशोधन करून हा कॉर्पस विकसीत केला आहे. यासाठीचे अप्लिकेशन डॉ. विवेक बेल्हेकर आणि राधिका भार्गव यांनी विकसित केले असून त्यातून उपलब्ध शब्दाची माहिती आलेखाच्या स्वरूपात प्राप्त होते.या कामाचा शोधनिबंध एल्साव्हीअर च्या “अप्लाईड कॉर्पस लिंग्विस्टिक्स” या जर्नलमध्ये नुकताच प्रसिद्ध झाला असून यातून तयार झालेला कॉर्पस हा संशोधकांच्या वापरासाठी खुला करुन देण्यात आल्याचे डॉ. बेल्हेकर यांनी सांगितले.
गरज का भासली?
मराठी ही भारतात सर्वाधिक बोलल्या जाणाऱ्या भाषापैकी आहे. मराठी भाषेचे ८३ दशलक्षाहून अधिक भाषिक आहेत. विभागामार्फत विविध भारतीय भाषांमध्ये, बोलीभाषेतील व्यक्तिमत्व दर्शविणाऱ्या शब्दांचा वापर करुन मानसशास्त्रीय घटकांच्या रचनेचा अभ्यास केला जातो. हा अभ्यास मनो-भाषिक दृष्टिकोन म्हणून ओळखला जातो. या संशोधनासाठी एखाद्या भाषेतील कोणते शब्द किती वेळा वापरले जातात, याची माहिती महत्वाची असते. गुगल एन-ग्रामने ही माहिती अनेक भाषांसाठी उपलब्ध करुन दिली असली तरी त्यात भारतीय भाषांचा समावेश नाही.त्यामुळे मराठी आणि हिंदीच्या मानस-भाषिक अभ्यासासाठी हा मराठी आणि हिंदी कॉर्पस विकसित करण्यात आला आहे.
कॉर्पस म्हणजे काय?
कॉर्पस म्हणजे एखाद्या विषयावर लेखन करताना वापरण्यात येणाऱया जवळपास सर्व शब्दांचा संग्रह. शब्द मोजणी कॉर्पसमध्ये प्रत्येक शब्द किती वेळा वापरला आहे याची माहिती असते. विद्यापीठात विकसित केलेल्या मराठी भाषेच्या कॉर्पसमध्ये प्रत्येक शब्दाचा वापर प्रत्येक दशकात किती वेळा होतो याची माहिती आहे.
उपयोग काय?
याचा वापर भाषाशास्त्र, सामाजिक शास्त्रे, मजकूर खणन (टेक्स्ट मायनिग), यंत्र-शिक्षण इत्यादीसाठी संशोधक करू शकतात. या संदर्भातील अधिक काम सुरू असून लवकरच अधिक उपयोगी भाषिक विश्लेषणाची साधने संशोधक आणि सर्वसामान्यांना उपलब्ध करुन दिली जाणार आहेत.
कुठे पाहाल?
भाषा आणि संस्कृतीबद्दल संशोधन प्रश्नांची उत्तरे देण्यासाठी हा डेटा https://osf.io/vd3xz/) लिंकवर उपलब्ध आहे. तर https://indianlangwordcorp.shinyapps.io/ILWC/ या लिंकवर वेबअॅप उपलब्ध आहे. या अॅपमध्ये जर एखादा शब्द मिळाला नाही तर ते नोंदविण्याची सोय सुद्धा आहे.