DeepSeek 'tốn hơn tỷ USD thay vì 5,6 triệu USD cho AI'

DeepSeek được ước tính tiêu tốn khoảng 1,6 tỷ USD để phát triển các mô hình AI thay vì dưới 6 triệu USD như công ty tuyên bố.

Theo SemiAnalysis, công ty nổi tiếng về nghiên cứu, tư vấn thị trường bán dẫn và AI, chi tiêu cho phần cứng của DeepSeek “cao hơn nhiều so với mức 500 triệu USD”. Bên cạnh đó, việc tạo dữ liệu tổng hợp để mô hình đào tạo đòi hỏi “lượng tính toán đáng kể”. Con số 5,6 triệu USD chỉ bao gồm chi phí đào tạo, chưa tính đến chi phí nghiên cứu, phát triển, chuẩn bị dữ liệu, bảo trì phần cứng và các vấn đề liên quan khác.

“Phân tích của chúng tôi cho thấy tổng chi phí vốn máy chủ có thể là 1,6 tỷ USD, trong đó phần đáng kể là 944 triệu USD liên quan đến vận hành các cụm máy này”, SemiAnalysis cho hay. “Họ còn phải thử nghiệm, đưa ra kiến trúc mới, thu thập và làm sạch dữ liệu, trả lương cho nhân viên và nhiều việc khác nữa”.

Giao diện phần mềm DeepSeek cùng logo công ty. Ảnh: Bảo Lâm

Đi sâu vào chi tiết, SemiAnalysis nhận định DeepSeek có thể đã tiếp cận khoảng 10.000 mẫu GPU Nvidia H800 giảm hiệu năng để tuân thủ lệnh cấm chip AI của Mỹ đối với Trung Quốc và khoảng 10.000 GPU H100. Ngoài ra, công ty có thể dùng phiên bản H20 để đào tạo các mô hình.

“Những GPU này được chia sẻ giữa quỹ đầu tư High-Flyer với DeepSeek, phân phối theo địa lý ở mức độ nào đó. Chúng được sử dụng để giao dịch, suy luận, đào tạo và nghiên cứu”, theo SemiAnalysis.

Thời gian qua, DeepSeek đăng nhiều thông tin săn tìm nhân tài AI, cũng như thường xuyên tổ chức sự kiện tuyển dụng tại các trường đại học hàng đầu Trung Quốc. Trong đó, công ty đề cập “cơ hội truy cập 10.000 GPU không giới hạn”, được cho là đưa ra mức lương hơn 1,3 triệu USD mỗi năm cho một số ứng viên triển vọng, cao hơn nhiều so với các công ty công nghệ lớn của Trung Quốc cũng như các phòng thí nghiệm AI thế giới như Moonshot.

“Nói rõ hơn, DeepSeek vẫn là duy nhất và đi đầu khi đạt mức tối ưu chi phí cho các mô hình AI mạnh mẽ”, SemiAnalysts nhấn mạnh, thêm rằng DeepSeek R1 là “mô hình rất tốt” và việc bắt kịp được ranh giới lý luận AI của toàn cầu nhanh như vậy là điều “thực sự ấn tượng”.

DeepSeek chưa đưa ra bình luận.

Trong các công bố trước đây của mình, DeepSeek cũng không đưa ra con số tổng thể, ngoài mức 5,576 triệu USD, chủ yếu để thuê máy chủ AI và “đào tạo chính thức” cho các mô hình. Có nghĩa, con số này chưa tính những chi phí liên quan đến nghiên cứu, các thí nghiệm liên quan đến kiến trúc, thuật toán hoặc dữ liệu.

Trước đó, một số chuyên gia cũng nhận định DeepSeek đã biết cách tối ưu huấn luyện mô hình AI của mình với chi phí thấp, nhưng 6 triệu USD chưa thực sự là con số cuối cùng. Yann LeCun, Giám đốc AI của Meta, nói có “hiểu lầm lớn” khi so sánh việc các công ty Mỹ chi hàng tỷ USD vào AI với DeepSeek.

“Có sự hiểu lầm lớn về đầu tư cơ sở hạ tầng AI. Phần lớn trong số hàng tỷ USD đó được đầu tư vào cơ sở hạ tầng để ‘suy luận’, không phải để đào tạo”, LeCun viết trên mạng xã hội Threads tuần trước. “Việc chạy dịch vụ trợ lý AI cho hàng tỷ người đòi hỏi rất nhiều tính toán. Khi bạn đưa khả năng hiểu video, lý luận, bộ nhớ quy mô lớn và các khả năng khác vào hệ thống AI, chi phí suy luận sẽ tăng lên. Vì thế, phản ứng của thị trường đối với DeepSeek là thiếu cơ sở”.

Thomas Sohmers, nhà sáng lập Positron – công ty khởi nghiệp về phần cứng AI, đồng ý với LeCun rằng suy luận sẽ chiếm tỷ trọng lớn hơn trong chi phí cơ sở hạ tầng AI. “Nhu cầu suy luận và chi tiêu cho cơ sở hạ tầng sẽ tăng nhanh chóng”, ông nói với Business Insider. “Trong tương lai, khi mức độ phổ biến cao hơn, DeepSeek sẽ phải xử lý nhiều yêu cầu hơn, qua đó buộc chi nhiều tiền hơn cho suy luận”.

Nói với CNBC,Alexandr Wang, CEO của Scale AI, cũng tiết lộ ông nắm thông tin DeepSeek đang sở hữu 50.000 chip Nvidia H100. “Tuy nhiên, do biện pháp kiểm soát xuất khẩu của Mỹ, DeepSeek không thể công khai điều này”, Wang nói. Elon Musk, nhà sáng lập xAI và thân cận với Tổng thống Donald Trump, tỏ ra đồng tình. “Rõ ràng là như vậy”, Musk nhận xét khi đăng lại video phỏng vấn Wang.

Để có chi phí thấp, công ty cũng được cho là đã sử dụng kỹ thuật “chưng cất”. Ngày 29/1, nói với FT, OpenAI cho rằng có dấu hiệu “chưng cất” mà họ nghi ngờ từ DeepSeek. Kỹ thuật này được các nhà phát triển sử dụng để đạt hiệu suất tốt hơn trên các mô hình nhỏ, bằng cách sử dụng đầu ra từ những mô hình lớn, cho phép họ có được kết quả tương tự trong các nhiệm vụ cụ thể với chi phí thấp hơn.

DeepSeek được Liang Wenfeng thành lập tháng 5/2023, đặt trụ sở ở Hàng Châu, Chiết Giang, và do quỹ đầu tư High-Flyer sở hữu. Công ty được High-Flyer tài trợ và không có kế hoạch huy động vốn, tập trung vào xây dựng công nghệ nền tảng.

Bảo Lâm

Hoài nghi về chi phí ‘siêu rẻ’ của AI Trung Quốc DeepSeek
‘Bố già AI’: Phản ứng của thị trường với DeepSeek là thiếu cơ sở
Ông chủ ChatGPT thừa nhận ‘ở phía sai của lịch sử’ sau cơn sốt DeepSeek
‘Chưng cất’ là gì khiến các công ty AI tiên phong lo ngại?

Thông báo: Baoangiang.com rất mong nhận được sự đóng góp ý kiến cũng như bài vở của bạn đọc gần xa. Quý bạn đọc có tin bài muốn cộng tác xin gửi về địa chỉ email: [email protected] hoặc zalo: 0909090909.

Chúng tôi sẽ có nhuận bút tương xứng với chất lượng của bài viết nếu bài viết của Quý đọc giả được chọn để đăng trên trang của chúng tôi. Xin cám ơn!

DeepSeek ‘tốn hơn tỷ USD thay vì 5,6 triệu USD cho AI’

Bài viết cùng chủ đề:

‘Bộ tứ báo thủ là bước lùi của Trấn Thành’

Đề xuất miễn thuế thu nhập cho nhà khoa học nghiên cứu công nghệ đường sắt đô thị

Thành lập Ban Tuyên giáo và Dân vận Tỉnh ủy Quảng Trị

Ông Trump kêu gọi Canada sáp nhập vào Mỹ để không bị đánh thuế

Diễn viên Từ Hy Viên qua đời ở tuổi 49

Thời cơ vươn mình của dân tộc

Khoảnh khắc UAV Nga bắn nổ xuồng không người lái Ukraine

Tin tức sáng 3-2: Thủ tướng đồng ý Lạng Sơn làm dự án nâng cấp Quốc lộ 1B; Du lịch TP.HCM tăng thu

Doanh nghiệp tìm kiếm thị trường xuất khẩu lao động mới

Thời tiết hôm nay 3-2: Huế tới Phú Yên mưa to; Nam Bộ sớm lạnh, ngày nắng

Paris Hilton mặc xuyên thấu ở tiệc tiền Grammy

Khai hội Gò Đống Đa 2025

Giá vàng tuần này có thể tăng

Stress ngày Tết làm tắt ‘lửa yêu’

Phim Trấn Thành chiếm hơn 70% doanh thu phòng vé Tết Ất Tỵ

‘Bộ tứ báo thủ là bước lùi của Trấn Thành’

Thị trường toàn cầu ‘đỏ lửa’ trước bão thuế quan của ông Trump

Đề xuất miễn thuế thu nhập cho nhà khoa học nghiên cứu công nghệ đường sắt đô thị

Thành lập Ban Tuyên giáo và Dân vận Tỉnh ủy Quảng Trị

Lập biên bản 3 tài xế che biển số mô tô, chạy tốc độ ‘bàn thờ’ trên quốc lộ 14

Chứng khoán trùm ‘đỏ’ ngày khai xuân, cổ phiếu công nghệ ‘vạ lây’ vì DeepSeek?

Chùa Hương tấp nập nam thanh nữ tú trẩy hội, lái đò có cả mã QR tương tác

Vụ cựu chủ tịch hối lộ bằng cổ phiếu, Công ty dịch vụ Điện lực lên tiếng

Giám đốc lừa bán dự án ‘ma’ ngất xỉu khi bị đề nghị án chung thân

Ba thanh niên nhậu xong thi bơi qua sông, một người mất tích

Chính phủ muốn lập Quỹ Bảo tồn di sản văn hóa

Ăn gì giúp tăng cường sinh lý?

Doanh nghiệp Hàn Quốc đồng hành cùng Việt Nam sao bão Yagi

Người đàn ông bị đánh dập não sau va quẹt xe ở Bình Dương đã qua đời

Chứng khoán… ‘mất điện’ – Tuổi Trẻ Online

Hàng ngàn người dân trải nghiệm những chuyến tàu metro số 1 sau đêm countdown

Người dân hào hứng đem quần áo cũ, pin, chai nhựa… đổi quà tại Ngày hội Sống xanh

AI trở thành nghề được trả lương cao nhất Trung Quốc

Ý kiến bạn đọc

Bài viết cùng chủ đề:

‘Bộ tứ báo thủ là bước lùi của Trấn Thành’

Đề xuất miễn thuế thu nhập cho nhà khoa học nghiên cứu công nghệ đường sắt đô thị

Thành lập Ban Tuyên giáo và Dân vận Tỉnh ủy Quảng Trị

Ông Trump kêu gọi Canada sáp nhập vào Mỹ để không bị đánh thuế

Diễn viên Từ Hy Viên qua đời ở tuổi 49

Thời cơ vươn mình của dân tộc

Khoảnh khắc UAV Nga bắn nổ xuồng không người lái Ukraine

Tin tức sáng 3-2: Thủ tướng đồng ý Lạng Sơn làm dự án nâng cấp Quốc lộ 1B; Du lịch TP.HCM tăng thu

Doanh nghiệp tìm kiếm thị trường xuất khẩu lao động mới

Thời tiết hôm nay 3-2: Huế tới Phú Yên mưa to; Nam Bộ sớm lạnh, ngày nắng

Paris Hilton mặc xuyên thấu ở tiệc tiền Grammy

Khai hội Gò Đống Đa 2025

Giá vàng tuần này có thể tăng

Stress ngày Tết làm tắt ‘lửa yêu’

Phim Trấn Thành chiếm hơn 70% doanh thu phòng vé Tết Ất Tỵ

Bài viết mới cập nhật:

‘Bộ tứ báo thủ là bước lùi của Trấn Thành’

Thị trường toàn cầu ‘đỏ lửa’ trước bão thuế quan của ông Trump

Đề xuất miễn thuế thu nhập cho nhà khoa học nghiên cứu công nghệ đường sắt đô thị

Thành lập Ban Tuyên giáo và Dân vận Tỉnh ủy Quảng Trị

Lập biên bản 3 tài xế che biển số mô tô, chạy tốc độ ‘bàn thờ’ trên quốc lộ 14

Chứng khoán trùm ‘đỏ’ ngày khai xuân, cổ phiếu công nghệ ‘vạ lây’ vì DeepSeek?

Chùa Hương tấp nập nam thanh nữ tú trẩy hội, lái đò có cả mã QR tương tác

Vụ cựu chủ tịch hối lộ bằng cổ phiếu, Công ty dịch vụ Điện lực lên tiếng

Giám đốc lừa bán dự án ‘ma’ ngất xỉu khi bị đề nghị án chung thân

Ba thanh niên nhậu xong thi bơi qua sông, một người mất tích

Chính phủ muốn lập Quỹ Bảo tồn di sản văn hóa

Ăn gì giúp tăng cường sinh lý?

Doanh nghiệp Hàn Quốc đồng hành cùng Việt Nam sao bão Yagi

Người đàn ông bị đánh dập não sau va quẹt xe ở Bình Dương đã qua đời

Chứng khoán… ‘mất điện’ – Tuổi Trẻ Online

Hàng ngàn người dân trải nghiệm những chuyến tàu metro số 1 sau đêm countdown

Người dân hào hứng đem quần áo cũ, pin, chai nhựa… đổi quà tại Ngày hội Sống xanh

AI trở thành nghề được trả lương cao nhất Trung Quốc