Startup Nhật Bản tuyên bố tạo "AI đa diện" ngang tầm Claude, nhưng sự thật phía sau là gì?

Sự thật đằng sau “AI đa diện” của startup Nhật Bản là gì?

Trong vài ngày qua, cộng đồng công nghệ quốc tế liên tục chia sẻ một thông tin gây chú ý: "Nhật Bản chính thức gia nhập cuộc đua AI frontier" sau khi startup Sakana AI có trụ sở tại Tokyo công bố Fugu Ultra, một hệ thống AI được giới thiệu là có năng lực ngang hàng với các mô hình tiên tiến của Anthropic như Claude Fable 5 và Mythos. Không ít bài đăng thậm chí còn mô tả đây là bước ngoặt giúp Nhật Bản lần đầu tiên sở hữu một mô hình đủ sức cạnh tranh với những tên tuổi dẫn đầu của Mỹ.

Tuy nhiên, khi đối chiếu với tài liệu kỹ thuật và thông báo chính thức của Sakana AI, bức tranh thực tế có nhiều điểm cần được nhìn nhận thận trọng hơn.

AI đa diện?

Điều đầu tiên cần làm rõ là Sakana AI thực sự đã công bố Fugu. Đây là sản phẩm mới nhất của startup AI Nhật Bản do các cựu kỹ sư Google thành lập, vốn nổi tiếng với định hướng phát triển "Collective Intelligence" - xây dựng các hệ thống AI hoạt động theo nguyên lý hợp tác giữa nhiều mô hình khác nhau thay vì chỉ dựa vào một mô hình khổng lồ duy nhất.

Trong thông báo phát hành, Sakana AI giới thiệu Fugu là một hệ thống điều phối đa tác tử (multi-agent orchestration). Thay vì trực tiếp giải quyết toàn bộ yêu cầu như cách GPT, Claude hay Gemini vận hành, Fugu đóng vai trò như một "nhạc trưởng". Khi nhận được câu hỏi, hệ thống sẽ phân tích bài toán, chia thành nhiều nhiệm vụ nhỏ, lựa chọn những mô hình phù hợp để xử lý từng phần, sau đó tổng hợp lại thành một câu trả lời hoàn chỉnh.

Chính vì vậy, Fugu không phải là một foundation model mới theo nghĩa truyền thống mà là một lớp điều phối thông minh đứng phía trên nhiều mô hình AI khác.

Đây cũng là điểm khiến nhiều bài đăng trên mạng xã hội dễ gây hiểu nhầm. Không ít nội dung mô tả Fugu như "một mô hình AI mới của Nhật Bản đánh bại Claude", trong khi bản chất của sản phẩm lại khác đáng kể. Giá trị cốt lõi của Fugu không nằm ở việc huấn luyện một mô hình ngôn ngữ khổng lồ từ đầu, mà ở khả năng phối hợp nhiều mô hình để tạo ra kết quả có chất lượng cao hơn.

Điểm gây chú ý nhất trong thông báo của Sakana AI là tuyên bố Fugu Ultra đạt hiệu năng tương đương các mô hình hàng đầu như Claude Fable 5 và Mythos trên nhiều bài kiểm tra về lập trình, khoa học và suy luận. Đây cũng là nguồn gốc của hàng loạt bài viết với tiêu đề khẳng định Nhật Bản đã sở hữu AI ngang tầm Anthropic.

Tuy nhiên, cần lưu ý rằng đây hiện vẫn là kết quả do chính Sakana AI công bố. Công ty chưa khẳng định Fugu vượt qua Claude hay thay thế hoàn toàn các mô hình frontier, mà chỉ cho biết hệ thống của họ đạt mức hiệu năng tương đương trên một số bộ benchmark nhất định. Cho đến thời điểm hiện tại, chưa có nhiều tổ chức nghiên cứu độc lập hoặc các bảng xếp hạng uy tín xác nhận đầy đủ những tuyên bố này.

Điều đó không đồng nghĩa Fugu không đáng chú ý. Ngược lại, giới chuyên môn đánh giá hướng tiếp cận của Sakana AI phản ánh một xu hướng mới trong ngành AI. Sau nhiều năm chạy đua xây dựng các mô hình ngày càng lớn với chi phí huấn luyện lên tới hàng tỷ USD, ngày càng nhiều công ty bắt đầu chuyển sang tối ưu khả năng điều phối nhiều mô hình hiện có nhằm đạt hiệu quả tương đương nhưng với chi phí thấp hơn và khả năng mở rộng linh hoạt hơn.

Sakana AI cũng nhấn mạnh rằng kiến trúc của Fugu giúp doanh nghiệp giảm sự phụ thuộc vào các mô hình do Mỹ phát triển. Một số bài đăng trên mạng xã hội đã diễn giải điều này thành việc Fugu "vượt qua các lệnh kiểm soát xuất khẩu của Mỹ". Cách diễn đạt này phần nào gây hiểu nhầm. Trên thực tế, Fugu không phải là công nghệ nhằm vô hiệu hóa các quy định kiểm soát xuất khẩu. Thay vào đó, hệ thống được thiết kế để có thể điều phối nhiều mô hình khác nhau, bao gồm các mô hình mã nguồn mở hoặc được triển khai trong nước, qua đó giảm sự lệ thuộc vào một nhà cung cấp duy nhất.

Các thử nghiệm ban đầu từ cộng đồng phát triển cũng cho thấy bức tranh cân bằng hơn so với những tuyên bố đầy hào hứng trên mạng xã hội. Nhiều nhà phát triển ghi nhận Fugu tạo ra kết quả chất lượng trong các tác vụ phức tạp, nhưng đổi lại thời gian xử lý có thể kéo dài đáng kể do phải điều phối nhiều mô hình cùng lúc. Với những yêu cầu đòi hỏi tốc độ phản hồi tức thì, đây vẫn là điểm cần tiếp tục được cải thiện.

Ý nghĩa của AI mới

Dẫu vậy, sự xuất hiện của Fugu vẫn mang ý nghĩa đáng chú ý đối với ngành AI toàn cầu. Trong nhiều năm, cuộc đua AI tiên tiến gần như xoay quanh các "ông lớn" của Mỹ như OpenAI, Anthropic, Google hay Meta. Việc một startup Nhật Bản lựa chọn con đường khác, tập trung vào khả năng điều phối thay vì xây dựng một mô hình khổng lồ, cho thấy cuộc cạnh tranh trong lĩnh vực AI đang trở nên đa dạng hơn về chiến lược công nghệ.

Vì vậy, sẽ là quá sớm để khẳng định "Nhật Bản đã tạo ra AI ngang Claude" như nhiều bài đăng lan truyền. Điều chính xác hơn là Sakana AI vừa giới thiệu một kiến trúc AI mới với nhiều ý tưởng đáng chú ý và công bố các kết quả benchmark rất tham vọng. Những tuyên bố này hiện vẫn cần thêm thời gian để được cộng đồng nghiên cứu và các tổ chức đánh giá độc lập kiểm chứng trên quy mô rộng.

Nếu Fugu tiếp tục chứng minh được hiệu năng trong các ứng dụng thực tế, đây có thể sẽ là một trong những dấu mốc quan trọng cho thấy tương lai của AI không chỉ nằm ở việc xây dựng những mô hình ngày càng lớn, mà còn ở khả năng kết nối và điều phối hiệu quả sức mạnh của nhiều mô hình khác nhau. Và đó mới có thể là đóng góp lớn nhất của Sakana AI đối với cuộc đua trí tuệ nhân tạo toàn cầu./

Link nội dung: https://www.phunuvathoidaivn.com/startup-nhat-ban-tuyen-bo-tao-ai-da-dien-ngang-tam-claude-nhung-su-that-phia-sau-la-gi-a190857.html