दीपसेक की आश्चर्यजनक रूप से सस्ती एआई मॉडल चुनौतियां उद्योग मानदंडों को चुनौती देती हैं। अपने डीपसेक वी 3 मॉडल के लिए केवल $ 6 मिलियन पूर्व-प्रशिक्षण लागत का दावा करते हुए, वास्तविकता कहीं अधिक जटिल है। कंपनी की स्व-रिपोर्ट की गई आंकड़ा पर्याप्त अनुसंधान, शोधन, डेटा प्रसंस्करण और बुनियादी ढांचे के खर्चों को छोड़ देता है।
दीपसेक का वी 3 मॉडल अभिनव प्रौद्योगिकियों का उपयोग करता है: मल्टी-टोकन भविष्यवाणी (एमटीपी) एक साथ शब्द भविष्यवाणी के लिए, विशेषज्ञों का मिश्रण (एमओई) 256 तंत्रिका नेटवर्क, और मल्टी-हेड अव्यक्त ध्यान (एमएलए) । * प्रमुख वाक्य तत्वों पर बेहतर ध्यान केंद्रित करने के लिए।
छवि: ensigame.com
हालांकि, एक अर्धसैनिक रिपोर्ट में कहीं अधिक पर्याप्त निवेश का पता चलता है। दीपसेक एक बड़े पैमाने पर कम्प्यूटेशनल इन्फ्रास्ट्रक्चर का संचालन करता है, जिसमें कई डेटा केंद्रों में लगभग 50,000 एनवीडिया हॉपर जीपीयू का उपयोग होता है, जो लगभग $ 1.6 बिलियन के कुल सर्वर निवेश का प्रतिनिधित्व करता है और $ 944 मिलियन के पास परिचालन लागत।
छवि: ensigame.com
यह न्यूनतम लागत के प्रारंभिक दावे का खंडन करता है। एक चीनी हेज फंड, हाई-फ्लायर की सहायक कंपनी दीपसेक अपने डेटा सेंटरों का मालिक है, नियंत्रण और तेजी से नवाचार को बढ़ावा देती है। इसकी स्व-वित्त पोषित प्रकृति चपलता को बढ़ाती है। कंपनी शीर्ष प्रतिभा को आकर्षित करती है, कुछ शोधकर्ताओं ने सालाना 1.3 मिलियन डॉलर से अधिक की कमाई की।
छवि: ensigame.com
दीपसेक का वास्तविक एआई विकास निवेश $ 500 मिलियन से अधिक है। जबकि इसकी दुबली संरचना नवाचार की सुविधा प्रदान करती है, "क्रांतिकारी बजट" कथा भ्रामक है। प्रतियोगियों के साथ तुलना विसंगति को उजागर करती है: दीपसेक के आर 1 मॉडल की लागत $ 5 मिलियन है, जबकि CHATGPT 4 की लागत $ 100 मिलियन है। फुलाए हुए दावों के बावजूद, दीपसेक की सफलता ने स्थापित दिग्गजों के साथ प्रभावी ढंग से प्रतिस्पर्धा करने के लिए अच्छी तरह से वित्त पोषित स्वतंत्र एआई कंपनियों की क्षमता को रेखांकित किया।
छवि: ensigame.com
अंततः, दीपसेक की सफलता पर्याप्त निवेश, तकनीकी प्रगति और एक कुशल टीम से उपजी है, न कि चमत्कारिक रूप से कम बजट। हालांकि, अपनी वास्तविक लागतों के साथ भी, यह अपने प्रतिद्वंद्वियों की तुलना में काफी सस्ता है।