'Chưng cất' là gì khiến các công ty AI tiên phong lo ngại?

Việc công ty AI ra đời sau dùng công nghệ, kỹ thuật để “chưng cất” (distillation) kiến thức của các mô hình AI đi trước gây nhiều lo ngại.

Trong thế giới AI, khái niệm “chưng cất” đề cập việc “chuyển giao kiến thức” từ mô hình này sang mô hình khác theo dạng giáo viên – học sinh. “Chưng cất là kỹ thuật được thiết kế để chuyển kiến thức của một mô hình lớn được đào tạo trước (giáo viên) thành một mô hình nhỏ hơn (học sinh), cho phép mô hình học sinh đạt được hiệu suất tương đương mô hình giáo viên”, hai nhà khoa học Vishal Yadav và Nikhil Pandey nói với Forbes. “Kỹ thuật này giúp người dùng tận dụng chất lượng của các mô hình ngôn ngữ lớn (LLM), đồng thời giảm chi phí suy luận”.

“Điều này giống như khi bạn có vài giờ phỏng vấn Einstein và bước ra với kiến thức gần bằng ông ấy về một lĩnh vực vật lý”, Ali Ghodsi, CEO công ty quản lý dữ liệu Databricks, nói với WSJ.

Ứng dụng DeepSeek trên App Store. Ảnh: *Tuấn Hưng*

Các mô hình AI hàng đầu từ OpenAI, Google, Meta hay Anthropic về cơ bản tự học từ đầu với lượng dữ liệu thô khổng lồ – quá trình thường mất nhiều tháng và tiêu tốn hàng chục triệu USD trở lên. Tuy nhiên, khi một công ty khác ra đời sau và sử dụng kết quả đã có từ các AI đi đầu này, quá trình chưng cất có thể giúp tạo ra một mô hình tốt trong vài tuần, thậm chí vài ngày, với chi phí ít hơn đáng kể.

“Điều dễ sao chép nhất là quy trình chưng cất”, nhà khoa học nghiên cứu cấp cao Lewis Tunstall viết trên blog cuối tuần trước.

Ngày 29/1, nói với FT, OpenAI phát hiện dấu hiệu “chưng cất” mà họ nghi ngờ từ DeepSeek. Kỹ thuật này được các nhà phát triển sử dụng để đạt hiệu suất tốt hơn trên các mô hình nhỏ, bằng cách sử dụng đầu ra từ những mô hình lớn, cho phép họ có được kết quả tương tự trong các nhiệm vụ cụ thể với chi phí thấp hơn. Đây là hoạt động phổ biến trong lĩnh vực AI nhưng có thể DeepSeek đã vi phạm điều khoản dịch vụ của OpenAI.

Trong khi đó, Bloomberg đưa tin OpenAI và đối tác Microsoft đang điều tra các tài khoản được cho là của DeepSeek từng sử dụng giao diện lập trình ứng dụng (API) của OpenAI vào năm ngoái và chặn quyền truy cập vì nghi ngờ có hành vi vi phạm điều khoản.

“Họ có thể chắt lọc để tạo ra một LLM thực sự tốt và sử dụng quy trình ‘chưng cất’ để làm điều đó”, Chetan Puttagunta, chuyên gia của Benchmark, nói với CNBC khi mô hình DeepSeek R1 được giới thiệu. “Về cơ bản, họ sử dụng một mô hình rất lớn để giúp mô hình nhỏ của mình trở nên thông minh và cách này rất tiết kiệm chi phí”.

Chưng cất không phải ý tưởng mới trong giới công nghệ. CNN dẫn các báo cáo khoa học cho thấy lĩnh vực được ứng dụng nhiều trước đó là xe tự lái. “Kiểu học tập này cho thấy tiềm năng to lớn trong nhiều lĩnh vực, như xe tự lái, điều khiển robot và chăm sóc sức khỏe”, trang này cho hay. “Trong lái xe tự động, chưng cất cho phép đào tạo hiệu quả và tinh chỉnh mô hình AI cho các nhiệm vụ như hợp nhất cảm biến, phát hiện vật thể và ra quyết định, đồng thời giảm mức tiêu thụ năng lượng và đảm bảo khả năng phản hồi theo thời gian thực”.

Tuy nhiên, thành công của DeepSeek đang gây chú ý, làm dấy lên những câu hỏi rằng việc chi hàng tỷ USD để tiên phong của các doanh nghiệp Mỹ liệu có mang lại lợi thế vô song, hay chỉ đóng vai trò là bàn đạp cho đối thủ rẻ hơn. Theo WSJ, các lãnh đạo AI tại Thung lũng Silicon đang xem xét lại mô hình kinh doanh của họ, đồng thời đặt câu hỏi liệu việc trở thành người dẫn đầu lĩnh vực có còn đáng giá hay không.

“Liệu có hiệu quả kinh tế khi đi đầu trong lĩnh vực với chi phí cao gấp 8 lần so với những công ty đang theo sau một cách nhanh chóng?”, Mike Volpi, một giám đốc công nghệ kỳ cựu, nhà đầu tư mạo hiểm và là nhà phân tích của Hanabi Capital, nhận xét.

Sau sự xuất hiện của DeepSeek, trên X, CEO OpenAI Sam Altman đánh giá các mô hình mới nhất của DeepSeek “ấn tượng, đặc biệt là về những gì có thể cung cấp với mức giá đó”, nhưng khẳng định “tiếp tục thực hiện lộ trình nghiên cứu của mình”.

Trong khi đó, Yann LeCun, Giám đốc AI của Meta, cũng cho rằng có “hiểu lầm lớn” khi so sánh việc công ty Mỹ chi hàng tỷ USD vào AI với DeepSeek. “Phần lớn trong số hàng tỷ USD đó được đầu tư vào cơ sở hạ tầng để ‘suy luận’, không phải để đào tạo”, LeCun viết trên mạng xã hội Threads giữa tuần này.

Trên blog, CEO Anthropic Dario Amodei cũng cho rằng hai mô hình chủ lực của DeepSeek “không phải một bước đột phá độc đáo hay thứ gì đó thay đổi nền kinh tế” của các hệ thống AI tiên tiến, mà là “một điểm dự kiến trên đường cong giảm chi phí AI đang diễn ra”.

Bên cạnh những lo ngại, giới công nghệ cũng mong đợi việc “chưng cất” sẽ sớm tạo ra các ứng dụng AI chất lượng cao. Chẳng hạn, nhóm các nhà nghiên cứu trên nền tảng Hugging Face đã bắt đầu xây dựng một mô hình tương tự DeepSeek vào tuần trước.

Thực tế, các mô hình từ OpenAI hay Google vẫn được đánh giá cao hơn nhiều so với DeepSeek. Những gã khổng lồ công nghệ này có khả năng duy trì lợi thế trong các hệ thống tiên tiến nhất vì họ thường xuyên tạo ra cái mới. Nói với Fox News, David Sacks, quan chức phụ trách chính sách trí tuệ nhân tạo và tiền điện tử Nhà Trắng, hy vọng các công ty Mỹ sẽ có cách để khiến “việc chưng cất các mô hình AI trở nên khó khăn hơn”.

Tuy nhiên, doanh nghiệp và người dùng cuối lại thích các công nghệ có chi phí rẻ. Cạnh tranh trong lĩnh vực AI thời gian qua vốn đã khốc liệt. Sự gia nhập của DeepSeek và các công ty sử dụng phương pháp chưng cất có thể thúc đẩy giá giảm hơn nữa.

“Ngoài giá, kỹ thuật chưng cất cũng hiệu quả trong việc bổ sung các khả năng mới cho mô hình AI hiện có”, Ion Stoica, giáo sư khoa học máy tính của UC Berkeley, nói với WSJ.

Bảo Lâm tổng hợp

Bình luận về dự án AI 10 triệu USD của Sam Altman hot trở lại
Tim Cook khen DeepSeek hiệu quả
Hạ viện Mỹ ‘cấm nhân viên dùng DeepSeek’
Nghi bị DeepSeek lợi dụng, công ty AI Mỹ vẫn khó ngăn chặn
DeepSeek bị phát hiện lộ dữ liệu nhạy cảm

Thông báo: Baoangiang.com rất mong nhận được sự đóng góp ý kiến cũng như bài vở của bạn đọc gần xa. Quý bạn đọc có tin bài muốn cộng tác xin gửi về địa chỉ email: [email protected] hoặc zalo: 0909090909.

Chúng tôi sẽ có nhuận bút tương xứng với chất lượng của bài viết nếu bài viết của Quý đọc giả được chọn để đăng trên trang của chúng tôi. Xin cám ơn!

‘Chưng cất’ là gì khiến các công ty AI tiên phong lo ngại?

Bài viết cùng chủ đề:

Hành trình của nữ lao động xuất khẩu thành chủ công ty triệu USD

Sân bay đông khách quay lại sau Tết

Khách Australia ví chợ Việt giống ‘thiên đường lẫn show kinh dị’

Mùng 4 Tết, Thủ tướng thị sát các dự án sân bay, cao tốc tại Đông Nam Bộ

Ông Trump: Trực thăng Mỹ bay quá cao khi va chạm

Người phụ nữ xuất khẩu bánh chưng sang Mỹ

Loạt dự án trọng điểm ở TP HCM hoàn thành năm 2025

Khổ vì chuyện xông đất đầu năm

Thời tiết hôm nay mùng 4 Tết: Bắc Bộ mưa rét; Nam Bộ sáng lạnh trưa nắng

4 thực phẩm ít làm tăng cân ngày Tết

Hòn đảo khốn đốn vì cơn mưa mảnh vỡ tên lửa Starship

Giữ rừng bằng hương ước

Nhiệm vụ ‘ngày tận thế’ của đơn vị trực thăng trong thảm kịch hàng không Washington

Học chuyên Sinh có nên theo ngành Quản trị kinh doanh?

Những điều chuyên gia trị liệu tình dục muốn bạn biết

Nhặt được ví da có 21 triệu khi đi chúc tết, nam thanh niên trả lại người mất

Lợi nhuận taxi Vinasun giảm mạnh

Hành trình của nữ lao động xuất khẩu thành chủ công ty triệu USD

Nghệ sĩ Lệ Thủy và ca sĩ Giao Linh ca cải lương mừng xuân mới trong Vầng trăng cổ nhạc

Giá vàng thế giới mỗi ngày lập một kỷ lục mới

Sân bay đông khách quay lại sau Tết

‘Chưng cất’ là gì khiến các công ty AI tiên phong lo ngại?

Chuyên gia: Trung tâm tài chính tại TP.HCM nên cân nhắc chấp nhận tiền mã hóa để tạo… khác biệt

Xiaomi MIX Flip – điện thoại gập có màn hình ngoài tràn viền

Người dân gói bánh, hàng quán tặng 1 ngày doanh thu ủng hộ đồng bào miền Bắc

Lincoln Navigator 2025 – SUV cỡ lớn tràn ngập công nghệ

Hàng chục điểm sạt lở ở Hà Giang

Điều gì xảy ra nếu rơi vào xoáy nước?

Một bệnh nhi dập phổi trong vụ cây xanh bật gốc đè trúng người đi đường tại TP.HCM

Trực tiếp trận Pháp vs Bỉ ở Euro 2024

Đề xuất mở rộng khách hàng được mua điện trực tiếp, không qua EVN

Saigon Co.op kích cầu tiêu dùng với tháng ‘Tự hào hàng Việt’

Cảnh sát giao thông dẫn đường đưa sản phụ đi cấp cứu

Ý kiến bạn đọc

Bài viết cùng chủ đề:

Hành trình của nữ lao động xuất khẩu thành chủ công ty triệu USD

Sân bay đông khách quay lại sau Tết

Khách Australia ví chợ Việt giống ‘thiên đường lẫn show kinh dị’

Mùng 4 Tết, Thủ tướng thị sát các dự án sân bay, cao tốc tại Đông Nam Bộ

Ông Trump: Trực thăng Mỹ bay quá cao khi va chạm

Người phụ nữ xuất khẩu bánh chưng sang Mỹ

Loạt dự án trọng điểm ở TP HCM hoàn thành năm 2025

Khổ vì chuyện xông đất đầu năm

Thời tiết hôm nay mùng 4 Tết: Bắc Bộ mưa rét; Nam Bộ sáng lạnh trưa nắng

4 thực phẩm ít làm tăng cân ngày Tết

Hòn đảo khốn đốn vì cơn mưa mảnh vỡ tên lửa Starship

Giữ rừng bằng hương ước

Nhiệm vụ ‘ngày tận thế’ của đơn vị trực thăng trong thảm kịch hàng không Washington

Học chuyên Sinh có nên theo ngành Quản trị kinh doanh?

Những điều chuyên gia trị liệu tình dục muốn bạn biết

Bài viết mới cập nhật:

Nhặt được ví da có 21 triệu khi đi chúc tết, nam thanh niên trả lại người mất

Lợi nhuận taxi Vinasun giảm mạnh

Hành trình của nữ lao động xuất khẩu thành chủ công ty triệu USD

Nghệ sĩ Lệ Thủy và ca sĩ Giao Linh ca cải lương mừng xuân mới trong Vầng trăng cổ nhạc

Giá vàng thế giới mỗi ngày lập một kỷ lục mới

Sân bay đông khách quay lại sau Tết

‘Chưng cất’ là gì khiến các công ty AI tiên phong lo ngại?

Chuyên gia: Trung tâm tài chính tại TP.HCM nên cân nhắc chấp nhận tiền mã hóa để tạo… khác biệt

Xiaomi MIX Flip – điện thoại gập có màn hình ngoài tràn viền

Người dân gói bánh, hàng quán tặng 1 ngày doanh thu ủng hộ đồng bào miền Bắc

Lincoln Navigator 2025 – SUV cỡ lớn tràn ngập công nghệ

​Hàng chục điểm sạt lở ở Hà Giang

Điều gì xảy ra nếu rơi vào xoáy nước?

Một bệnh nhi dập phổi trong vụ cây xanh bật gốc đè trúng người đi đường tại TP.HCM

Trực tiếp trận Pháp vs Bỉ ở Euro 2024

Đề xuất mở rộng khách hàng được mua điện trực tiếp, không qua EVN

Saigon Co.op kích cầu tiêu dùng với tháng ‘Tự hào hàng Việt’

Cảnh sát giao thông dẫn đường đưa sản phụ đi cấp cứu

Hàng chục điểm sạt lở ở Hà Giang