โมเดล AI ราคาไม่แพงอย่างน่าประหลาดใจของ Deepseek ท้าทายบรรทัดฐานของอุตสาหกรรม ในขณะที่มีค่าใช้จ่ายก่อนการฝึกอบรมเพียง 6 ล้านเหรียญสหรัฐสำหรับรุ่น Deepseek V3 ความเป็นจริงนั้นซับซ้อนกว่ามาก ตัวเลขที่รายงานด้วยตนเองของ บริษัท ละเว้นการวิจัยการปรับแต่งการประมวลผลข้อมูลและค่าใช้จ่ายโครงสร้างพื้นฐานที่สำคัญ
โมเดล V3 ของ Deepseek ใช้เทคโนโลยีที่เป็นนวัตกรรม: การทำนายแบบหลายท็อก (MTP) สำหรับการทำนายคำพร้อมกัน ส่วนผสมของผู้เชี่ยวชาญ (MOE) ใช้เครือข่ายประสาท 256 และ ความสนใจแฝงหลายหัว (MLA) * สำหรับการปรับปรุงการมุ่งเน้นไปที่องค์ประกอบประโยคสำคัญ
IMGP%Image: Ensigame.com
อย่างไรก็ตามรายงาน semianalysis เผยให้เห็นการลงทุนที่สำคัญยิ่งขึ้น Deepseek ดำเนินการโครงสร้างพื้นฐานการคำนวณขนาดใหญ่โดยใช้ GPU Nvidia Hopper ประมาณ 50,000 Nvidia ในศูนย์ข้อมูลหลายแห่งซึ่งเป็นตัวแทนของการลงทุนเซิร์ฟเวอร์ทั้งหมดประมาณ 1.6 พันล้านเหรียญสหรัฐและค่าใช้จ่ายในการดำเนินงานใกล้กับ $ 944 ล้าน
IMGP%Image: Ensigame.com
สิ่งนี้ขัดแย้งกับการเรียกร้องเริ่มต้นของค่าใช้จ่ายน้อยที่สุด Deepseek ซึ่งเป็น บริษัท ในเครือของ High-Flyer ซึ่งเป็นกองทุนป้องกันความเสี่ยงของจีนเป็นเจ้าของศูนย์ข้อมูลส่งเสริมการควบคุมและนวัตกรรมอย่างรวดเร็ว ธรรมชาติที่ได้รับการสนับสนุนตนเองช่วยเพิ่มความคล่องตัว บริษัท ดึงดูดความสามารถสูงสุดโดยนักวิจัยบางคนมีรายได้มากกว่า 1.3 ล้านเหรียญสหรัฐต่อปี
IMGP%Image: Ensigame.com
การลงทุนการพัฒนา AI ที่เกิดขึ้นจริงของ Deepseek เกิน $ 500 ล้าน ในขณะที่โครงสร้างแบบลีนอำนวยความสะดวกในการสร้างนวัตกรรมการเล่าเรื่อง "งบประมาณปฏิวัติ" นั้นทำให้เข้าใจผิด การเปรียบเทียบกับคู่แข่งเน้นความแตกต่าง: รุ่น R1 ของ Deepseek มีราคา $ 5 ล้านในขณะที่ Chatgpt 4 มีราคา $ 100 ล้าน แม้จะมีการเรียกร้องที่สูงเกินจริงความสำเร็จของ Deepseek ได้เน้นย้ำถึงศักยภาพของ บริษัท AI อิสระที่ได้รับการสนับสนุนอย่างดีในการแข่งขันอย่างมีประสิทธิภาพกับยักษ์ใหญ่ที่จัดตั้งขึ้น
IMGP%Image: Ensigame.com
ในที่สุดความสำเร็จของ Deepseek เกิดจากการลงทุนที่สำคัญความก้าวหน้าทางเทคโนโลยีและทีมที่มีทักษะไม่ใช่งบประมาณที่ต่ำอย่างน่าอัศจรรย์ อย่างไรก็ตามแม้จะมีค่าใช้จ่ายที่แท้จริง แต่ก็ยังคงถูกกว่าคู่แข่งอย่างมีนัยสำคัญ