Mô hình AI rẻ tiền đáng ngạc nhiên của Deepseek thách thức các chuẩn mực ngành. Trong khi tự hào với chi phí đào tạo trước 6 triệu đô la cho mẫu DeepSeek V3, nhưng thực tế phức tạp hơn nhiều. Con số tự báo cáo của công ty bỏ qua nghiên cứu đáng kể, sàng lọc, xử lý dữ liệu và chi phí cơ sở hạ tầng.
Mô hình V3 của Deepseek sử dụng các công nghệ sáng tạo: Dự đoán đa điểm (MTP) để dự đoán từ đồng thời, * Hỗn hợp các chuyên gia (MOE) Để cải thiện tập trung vào các yếu tố câu chính.
Hình ảnh: Obligame.com
Tuy nhiên, một báo cáo bán phân tích cho thấy một khoản đầu tư đáng kể hơn nhiều. Deepseek vận hành một cơ sở hạ tầng tính toán lớn, sử dụng khoảng 50.000 GPU phễu NVIDIA trên nhiều trung tâm dữ liệu, đại diện cho tổng đầu tư của máy chủ khoảng 1,6 tỷ đô la và chi phí hoạt động gần 944 triệu đô la.
Hình ảnh: Obligame.com
Điều này mâu thuẫn với yêu cầu ban đầu về chi phí tối thiểu. Deepseek, một công ty con của High Flyer, một quỹ phòng hộ của Trung Quốc, sở hữu các trung tâm dữ liệu của mình, thúc đẩy kiểm soát và đổi mới nhanh chóng. Bản chất tự tài trợ của nó giúp tăng cường sự nhanh nhẹn. Công ty thu hút tài năng hàng đầu, với một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm.
Hình ảnh: Obligame.com
Đầu tư phát triển AI thực tế của Deepseek vượt quá 500 triệu đô la. Trong khi cấu trúc nạc của nó tạo điều kiện cho sự đổi mới, thì câu chuyện "Ngân sách cách mạng" là sai lệch. Một so sánh với các đối thủ cạnh tranh nhấn mạnh sự khác biệt: Mô hình R1 của Deepseek có giá 5 triệu đô la, trong khi TATGPT 4 có giá 100 triệu đô la. Bất chấp những tuyên bố bị thổi phồng, thành công của Deepseek nhấn mạnh tiềm năng của các công ty AI độc lập được tài trợ tốt để cạnh tranh hiệu quả với những người khổng lồ đã thành lập.
Hình ảnh: Obligame.com
Cuối cùng, thành công của Deepseek xuất phát từ đầu tư đáng kể, tiến bộ công nghệ và một đội ngũ lành nghề, không phải là một ngân sách thấp kỳ diệu. Tuy nhiên, ngay cả với chi phí thực sự của nó, nó vẫn rẻ hơn đáng kể so với các đối thủ cạnh tranh.