-चिन्मय गवाणकर (माहिती तंत्रज्ञान विशेषज्ञ)
ओपन सोर्स करता येईल म्हणजे 'सोर्स कोड' कुणालाही फुकट देता येईल इतके 'डीपसीक' Al स्वस्त आहे, हे आपण काल प्रसिद्ध झालेल्या पूर्वार्धात पाहिले. हे चीनला कसे जमले? एक उदाहरण घ्या! समजा, आजारी पडून तुम्ही रुग्णालयात गेलात. तिथे एकच सुपरस्पेशालिस्ट डॉक्टर असेल तर त्याला खूप वेळ आणि पैसे खर्च करून वर्षानुवर्षे अभ्यास करून वैद्यकशास्त्रातील सगळे ज्ञान शिकावे लागेल. मग रुग्णाला सर्दी झाली असो वा हृदयविकार, तो सारखीच महागडी फी घेईल.
समजा, तुम्हाला सर्दी-खोकला झालाय, तर हृदयरोगतज्ज्ञाची फी देण्याची गरज काय? कुणीही साधा फॅमिली डॉक्टर किरकोळ फी घेऊन तुम्हाला औषधे देऊ शकेलच की। अमेरिकन LLM हे असे आहे. AI ला 'शिकवण्या' साठी लार्ज लेंग्वेज मॉडेल्स (LLM) लागतात. अमेरिकन LLM कडे 'सर्वज्ञ' होण्याचा अट्टाहास असल्याने ही मॉडेल्स जास्त डेटा, जास्त ऊर्जा वापरून इंटरनेटवर उपलब्ध असलेल्या सर्व माहिती-संचात संचार करून उत्तरं घेऊन येतात. हे प्रकरण भलते महाग पडते. हा खर्च वसूल करण्यासाठी मग या कंपन्या आपली आज्ञावली अर्थात कोड गुपित ठेवतात.
डीपसीकने 'मिश्रण विशेषज्ञ' (Mixture of Experts) पद्धत वापरली. डीपसीकच्या तत्त्वावर चालणाऱ्या रुग्णालयामध्ये एक जनरल एमएमबीएस डॉक्टर, एक फिजिशियन, एखादा हाडवैद्यक, एखादा स्त्रीरोगतज्ज्ञ, एखादा मधुमेह स्पेशालिस्ट असे विविध डॉक्टरांचे मंडळ आहे. त्यांना एकाच क्षेत्रात शिकायचे असल्याने शिकण्यासाठी वेळ आणि खर्च कमी लागल्याने त्यांची फीसुद्धा कमी आहे. रुग्णाला कोणत्या 'एक्सपर्ट'कडे पाठवायचे हे फॅमिली डॉक्टर ठरवतो. हीच संकल्पना डीपसीकने आपल्या मॉडेल्सना शिकवायला आणि मॉडेल्सकडून कमी वेळात, कमी खर्चात उत्तरे मिळविण्यास वापरली. फक्त २०४८ जीपीयू वापरून फक्त ४८ कोटी रुपयांत डीपसिक R-१ हे मॉडेल बनवले, जे तगड्या अमेरिकन मॉडेल्सएवढेच अचूक आणि विचारपूर्वक उत्तरे देते. ते गुगलच्या ३५ पट स्वस्त आणि ओपन AI च्या १६ पट स्वस्त आहे.
डीपसीकने हे मॉडेल चक्क ओपन सोर्स म्हणजे जगभरच्या संशोधकांना फुकट उपलब्ध करून दिले आहे. कुणीही संशोधक त्यांचा सोर्स कोड वापरून आपले अॅप्लिकेशन बनवू शकतो. हे मॉडेल ओपन सोर्स असल्यामुळे लहान स्टार्टअप्स आणि संशोधकांना LLM च्या क्षेत्रात काम करण्याची संधी मिळू शकते. यामुळे एखादा छोटा व्यवसाय स्वतःच्या गरजेनुसार 'टेलर मेड' LLM स्वस्तात तयार करू शकेल, एखादा डॉक्टर आपल्या रुग्णांच्या डेटावर आधारित AI टूल बनवू शकेल किंवा एखादा शिक्षक आपल्या विद्यार्थ्यांसाठी खास शैक्षणिक साहित्य तयार करू शकेल.
यामुळे वेगवेगळ्या क्षेत्रांमध्ये AI चा वापर वाढेल आणि नवनवीन कल्पनांना चालना मिळेल. डीपसीकच्या स्वस्तातल्या ओपन सोर्स मॉडेलची अचूकता साधारण मोठ्या मॉडेल्सएवढी आहे. हाच AI संशोधनातील खूप महत्त्वाचा मैलाचा दगड आहे. डीपसीकचे मूळ चीनमध्ये असल्याने त्यांच्या 'बोलविता धन्या'बद्दल कुजबुज सुरू झाली आहे. त्यांचा विदा संग्रह नक्की त्यांनी कुठून घेतला याबद्दल जगभरात मतमतांतरे आहेत. चीन सरकारसाठी 'अडचणी'च्या असणाऱ्या विषयांवर सध्या डीपसीकचा चॅट बॉट 'अर्थपूर्ण मौन' बाळगतोय (डीपसीकला मी स्वतः तिआनमेन चौकात १९८९ साली काय झाले, असे विचारले तेव्हा त्याने उत्तर दिले नाही). डीपसीकच्या मागे हा चीन सरकारचा 'अदृश्य हात' असल्याने त्याचा वापर चीनबाहेर खरोखर होईल का, किती आणि त्यांना दिलेली विदा चिनी परिप्रेक्ष्यामध्ये सुरक्षित राहील का, या प्रश्नांची उत्तरे येणारा काळच देईल.
भारताने मात्र यातून खूप काही शिकले पाहिजे. स्वदेशी क्रायोजनिक इंजिन, स्वदेशी अणुभट्टी, स्वदेशी परम महासंगणक बनविणाऱ्या आणि हॉलिवूड सिनेमाच्या बजेटच्या १० टक्के खर्चात मंगळावर स्वारी करणाऱ्या भारतीय अभियंत्यांनी मनात आणले तर त्यांना काहीही अशक्य नाही!
ता.क.: अलीबाबा या दुसऱ्या तगड्या चिनी कंपनीने आपले क्वेन २.५ मॅक्स हे LLM जाहीर केले जे डीपसीकच्या तत्त्वावर चालते आणि डीपसीकपेक्षा अचूक आहे असा त्यांचा दावा आहे! म्हणजे ही शर्यत आता अजून रंजक होणार ! (उत्तरार्ध)Chinmaygavankar@gmail.com