कई लोगों के लिए, एआई के परिवर्तन के वादे अभी तक सार्थक रूप से भौतिक हैं। Google खोज या सोशल मीडिया पर AI-SUGGESTED टिप्पणी का एक मशीन-जनित सारांश एक क्रांति नहीं है। लेकिन वह जल्द ही बदल सकता है। 2025 के दौरान एआई में परिभाषित बदलाव सिर्फ बड़े या बेहतर मॉडलों के बारे में नहीं होगा, लेकिन उन्हें रोजमर्रा की जिंदगी में वास्तव में उपयोगी बनाने के बारे में।
जब चटप्ट पहली बार दिखाई दिया, तो बहुत से प्रारंभिक नवाचार में ‘एआई रैपर्स’ शामिल थे, या ऐप्स को बड़े भाषा मॉडल (एलएलएम) में प्लग किए बिना बहुत अधिक अद्वितीय कार्यक्षमता को जोड़े बिना प्लग किया गया। फिर एक काउंटरट्रेंड उभरा, जिसमें स्टार्टअप्स ने एआई को अनुप्रयोगों में गहराई से एकीकृत करने पर ध्यान केंद्रित किया, कोडिंग सहायकों से लेकर सामग्री-निर्माण उपकरण तक।
जैसा कि मैं इसे देखता हूं, एआई बाजार अब एक स्मार्टफोन की तरह एक संक्रमण से गुजरता है, जो मूल ऐड-ऑन से पूरी तरह से एम्बेडेड एआई-प्रथम अनुप्रयोगों से आगे बढ़ता है। याद रखें, स्मार्टफोन को एक एकल आविष्कार द्वारा परिभाषित नहीं किया गया था, लेकिन इसके चारों ओर उभरे उत्पादों के एक पारिस्थितिकी तंत्र द्वारा।
दीपसेक के मॉडल इस अगले चरण की नींव हो सकते हैं। R1 की इसकी रिलीज़ सिर्फ इसलिए महत्वपूर्ण थी क्योंकि यह क्षमता में शीर्ष स्तरीय AI मॉडल से मेल खाता था, बल्कि इसलिए कि यह सामान्य लागत के एक अंश पर विकसित किया गया था और मुफ्त में जारी किया गया था, जैसे कि उबेर और अन्य जैसे ऐप्स स्मार्टफोन पारिस्थितिकी तंत्र के लिए मौलिक हो गए थे। स्टैंडअलोन सेवाओं की तुलना में। दूसरे शब्दों में, ये ऐप ‘रैपर’ होने से परे चले गए।
यह भी पढ़ें: पेरिस एआई एक्शन समिट भारत को इस महत्वपूर्ण क्षेत्र में अपना खेल बढ़ाने में मदद कर सकता है
यह समझने के लिए कि आर 1 इतना महत्वपूर्ण क्यों है, यह देखने में मदद कर सकता है कि एआई मॉडल कैसे बनाए जाते हैं।
एक भाषा मॉडल को प्रशिक्षित करने में दो प्रमुख चरण शामिल होते हैं: पूर्व-प्रशिक्षण और पोस्ट-ट्रेनिंग। पूर्व तब होता है जब एक एआई मॉडल सार्वजनिक रूप से उपलब्ध पाठ की विशाल मात्रा को अवशोषित करता है और मानव जैसी प्रतिक्रियाओं को उत्पन्न करना सीखता है। इस प्रक्रिया के परिणामस्वरूप एक आधार मॉडल होता है जिसमें व्यापक ज्ञान होता है लेकिन इसमें ठीक ट्यूनिंग का अभाव होता है। यह कम्प्यूटेशनल रूप से महंगा भी है और इसके लिए भारी प्रसंस्करण शक्ति की आवश्यकता होती है, इसलिए यह अब तक ओपनआईए और गूगल डीपमाइंड जैसी अच्छी तरह से वित्त पोषित कंपनियों द्वारा हावी है।
प्रशिक्षण के बाद का चरण मॉडल की प्रतिक्रियाओं को परिष्कृत करता है, जिससे वे अधिक सटीक और उपयोगी होते हैं। पर्यवेक्षित फाइन-ट्यूनिंग में मानव प्रशिक्षक शामिल हैं, जो मॉडल को अच्छी प्रतिक्रियाओं को पहचानने में मदद करने के लिए प्रश्न-उत्तर जोड़े बनाते हैं। Openai ने मानव प्रतिक्रिया (RLHF) के साथ सुदृढीकरण सीखने का नेतृत्व किया, जहां मानव समीक्षक आगे शोधन के लिए AI- जनित प्रतिक्रियाएं स्कोर करते हैं। ये दृष्टिकोण प्रभावी लेकिन महंगे हैं, क्योंकि वे बहुत अधिक मानव श्रम लेते हैं।
दीपसेक की सफलता प्रशिक्षण के बाद में मानवीय भागीदारी का उन्मूलन थी। इसने एक समय में एक शब्द के साथ जाने के बजाय पूरे वाक्यांशों की भविष्यवाणी की, जैसे कि पुराने एलएलएम ने किया था। एआई-जनित प्रतिक्रियाओं को रेट करने के लिए मानव मूल्यांकनकर्ताओं पर भरोसा करने के बजाय, R1 एक स्वचालित प्रणाली का उपयोग करता है जिसमें एक कंप्यूटर स्कोर प्रदान करता है। यह उच्च सटीकता बनाए रखते हुए लागत को काफी कम कर देता है – कम से कम गणित और प्रोग्रामिंग जैसे उद्देश्य डोमेन में। ट्रेड-ऑफ यह है कि जबकि यह विधि तार्किक तर्क के लिए अच्छी तरह से काम करती है, यह ओपन-एंडेड, व्यक्तिपरक या संदर्भ-भारी प्रश्नों के साथ संघर्ष करती है।
यह भी पढ़ें: जसप्रीत बिंद्रा: एआई के के-आकार का प्रक्षेपवक्र भारत को एक बड़ा अवसर प्रदान करता है
अपने उपन्यास प्रशिक्षण दृष्टिकोण से परे, दीपसेक ने हार्डवेयर दक्षता पर भी बड़ा स्कोर किया। जबकि अधिकांश एआई डेवलपर्स प्रदर्शन को अधिकतम करने के लिए नवीनतम एनवीडिया जीपीयू पर भरोसा करते हैं, डीपसेक ने आर 1 को काटने के बिना आर 1 को प्रशिक्षित करने के लिए पुराने कम्प्यूटिंग इन्फ्रास्ट्रक्चर को अनुकूलित किया। NVIDIA के CUDA सॉफ्टवेयर, उद्योग मानक का उपयोग करने के बजाय, इसने विधानसभा भाषा में प्रोग्रामिंग के अधिक जटिल दृष्टिकोण को लिया, जिससे इसके मॉडल सीधे हार्डवेयर के साथ बातचीत कर सकते हैं। इसने उच्च दक्षता का वर्तनी, चिप्स पर निर्भरता को कम करते हुए कि अमेरिकी प्रतिबंधों ने चीनी कंपनियों के लिए अधिग्रहण करना मुश्किल बना दिया है।
R1 के आगमन का समय विशेष रूप से उल्लेखनीय था। लगभग तुरंत, अन्य AI मेजर ने उन्नत तर्क मॉडल पेश किए, जिसमें Openai के O1 और O3 और Google DeepMind की मिथुन 2.0 फ्लैश थिंकिंग शामिल हैं। रैपिड रिलीज का सुझाव है कि इन कंपनियों के पास समान मॉडल थे, लेकिन उन्हें जारी करने में संकोच किया गया था, संभवतः उनके प्रीमियम प्रसाद की रक्षा करने के लिए। दीपसेक के मुक्त आर 1 ने प्रतिद्वंद्विता को तेज करते हुए, उनके हाथ को मजबूर कर दिया।
मान लीजिए कि तर्क-आधारित एआई मॉडल वास्तव में एक बार की तुलना में बनाने के लिए आसान और सस्ते हैं। उस मामले में, सार्वजनिक डोमेन में उच्च-प्रदर्शन एआई की उपलब्धता, बड़े, पुराने और महंगे रूप से पूर्व-प्रशिक्षित एलएलएम पर निर्मित, तेजी से बढ़ सकती है, प्रवेश के लिए बाधाओं को कम कर सकती है और प्रतिस्पर्धा को बढ़ा सकती है।
दीपसेक और इसके नए प्रतिद्वंद्वियों को इस संक्रमण का नेतृत्व करने के लिए अच्छी तरह से रखा गया है। यदि वे अपने मॉडलों को विभिन्न अनुप्रयोगों में परिष्कृत और एकीकृत करते हैं, तो वे बुनियादी ढांचे का निर्माण कर सकते हैं जो अनगिनत एआई-चालित उपकरणों को शक्तियां देता है। एआई ने पहले से ही सॉफ्टवेयर विकास में प्रमुख अंतर्विरोधी बना दिया है, जिससे भारतीय व्यवसायों को जोखिम में डाल दिया गया है। फिर भी, अभी भी वास्तव में निर्बाध एआई-प्रथम प्लेटफ़ॉर्म नहीं है जो विभिन्न उद्योगों और वर्कफ़्लोज़ को एकीकृत करता है। इस तरह के एक मंच बनाने वाली फर्मों की संभावना एआई के अगले युग को परिभाषित करेगी।
यह भी पढ़ें: पश्चिम को एआई संकट से निपटने के लिए जल्दी और निर्णायक रूप से कार्य करना चाहिए
बेस मॉडल उच्च कीमत वाले वस्तुओं बन सकते हैं। यह इस संभावना को बढ़ाता है कि एआई स्मार्टफोन पथ का पालन करेगा – एक उन्नत एआई बेस मॉडल के साथ एक भौतिक उत्पाद में बनाया गया है और हार्डवेयर के लिए प्रीमियम चार्ज करने वाली कंपनियां, जबकि सॉफ्टवेयर ऐप व्यापक रूप से सुलभ हैं। यह आज के एआई परिदृश्य से एक बड़ी पारी को चिह्नित करेगा, जहां एआई मॉडल मुख्य रूप से स्टैंडअलोन उपकरण हैं, एक भविष्य के पक्ष में जहां एआई हमारे दैनिक डिजिटल इंटरैक्शन का हिस्सा है।
2025 की कहानी एक ही सफलता के इर्द -गिर्द नहीं घूम सकती है, लेकिन एआई का उद्भव डिजिटल बुनियादी ढांचे की एक मौलिक परत के रूप में, अनगिनत नए अनुप्रयोगों को चलाने और प्रौद्योगिकी के अगले युग को आकार देने के लिए।
लेखक एक वेंचर फंड मैनेजर, सियाना कैपिटल के सह-संस्थापक हैं।