|
 Thuật ngữ VietnamBiz
Kinh doanh

Cơn sốt DeepSeek giá rẻ khuấy đảo thị trường, trong khi FPT mua hàng nghìn siêu chip Nvidia để làm gì?

10:31 | 04/02/2025
Chia sẻ
Thành công của DeepSeek với AI giá rẻ đặt ra câu hỏi lớn về chiến lược đầu tư khủng vào siêu chip của Nvidia.

Cuối tháng 4 năm ngoái, tại lễ ký kết với Nvidia ở Hà Nội, đại diện FPT cho biết sẽ đầu tư 200 triệu USD để xây dựng nhà máy AI (AI Factory) có chủ quyền của Việt Nam. Nhà máy AI này không sản xuất phần cứng, hoạt động dựa trên nền tảng công nghệ mới nhất của Nvidia, gồm bộ ứng dụng và khung công nghệ phát triển AI trong AI Enterprise và chip đồ họa GPU H100 Tensor Core.

Ngay trong năm 2024, lô hàng đầu tiên của Nvidia đã cập bến FPT. Thông tin từ FPT, nhà máy AI được trang bị hàng nghìn chip đồ hoạ Nvidia GPU H100 sẵn sàng cung cấp dịch vụ từ tháng 1/2025.

“Với năng lực tính toán hàng tỷ tỷ phép tính mỗi giây và hệ sinh thái các giải pháp công nghệ tích hợp GenAI, doanh nghiệp chỉ cần vài giờ để tạo ra một nhân sự AI thông minh, tối ưu các mô hình ngôn ngữ lớn (LLM) và nâng cao năng lực sáng tạo gấp 10 lần”, phía FPT cho biết về vai trò của những chip siêu mạnh từ Nvidia.

Lô hàng chip Nvidia cập bến FPT. (Ảnh: FPT).

Chi tiết về dự án nhà máy AI, tại Techday 2024, ông Lê Hồng Việt - Tổng giám đốc FPT Smart Cloud - đơn vị trực tiếp phụ trách nhà máy đã cho biết thêm. Ông Việt cho hay, nhà máy AI cung cấp ba nhóm sản phẩm chính gồm: FPT AI Infrastructure, FPT AI Studio và FPT AI Inference.

Trong đó, FPT AI Infrastructure mang tới các dịch vụ đám mây GPU với năng lực siêu tính toán bậc nhất để tăng tốc xây dựng và triển khai các mô hình AI lớn.

Nền tảng FPT AI Studio cung cấp các công cụ thông minh giúp xây dựng, đào tạo và tinh chỉnh chuyên sâu các mô hình AI nhờ ứng dụng Nvidia NeMo.

FPT AI Inference, kết hợp với Nvidia NIM và Nvidia AI Blueprints, cho phép triển khai và mở rộng các mô hình này về quy mô và số lượng sử dụng một cách hiệu quả.

Ngoài ra, nhà máy AI của FPT cũng cung cấp hơn 20 sản phẩm AI tạo sinh, giúp doanh nghiệp ứng dụng AI nâng cao hiệu suất vận hành, trải nghiệm khách hàng, phát triển nguồn nhân lực, và tối ưu hoá chi phí vận hành.

Tóm lại, nhà máy AI của FPT dùng chip xử lý mạnh nhất từ Nvidia nhằm cung cấp dịch vụ đám mây GPU giúp khách hàng doanh nghiệp tiếp cận với nguồn lực, nâng cao năng lực nghiên cứu, đẩy nhanh tốc độ ứng dụng AI, đặc biệt là AI tạo sinh. Đồng thời, giúp FPT tăng tốc xây dựng, phát triển các nền tảng, ứng dụng AI cho khách hàng.

Con đường tiếp cận và xây dựng nền tảng AI của FPT tương tự các “ông lớn” công nghệ như Meta hay Microsoft đang tiến hành. Tức, sử dụng chip đồ hoạ mạnh mẽ của Nvidia để xây dựng và đào tạo các nền tảng AI.

Thành công của DeepSeek đặt ra câu hỏi về việc đầu tư khủng vào hệ thống chip của Nvidia nhằm phát triển AI. (Ảnh: WSJ).

Không tiếp cận theo con đường truyền thống, đầu năm nay mô hình ngôn ngữ DeepSeek đã mở ra một hướng tiếp cận AI với chi phí tối ưu hơn rất nhiều cho các doanh nghiệp. Theo Bloomberg, các bài đánh giá cho thấy DeepSeek có hiệu suất ngang bằng hoặc vượt trội cho với các mô hình đối thủ trên thị trường ở nhiều tiêu chí quan trọng với giá thấp hơn đáng kể.

Hiệu suất cao và chi phí thấp của DeepSeek đặt ra câu hỏi về việc có cần đầu tư hàng tỷ USD để mua các bộ tăng tốc AI mạnh nhất từ Nvidia hay không. 

Vậy DeepSeek làm thế nào để có nền tảng AI với giá rẻ? Công ty Trung Quốc đã sử dụng phương pháp gọi là “distillation” (chưng cất tri thức). Đây là cách một hệ thống AI mới học từ một hệ thống AI đã có sẵn bằng cách đặt ra hàng trăm nghìn câu hỏi, sau đó phân tích câu trả lời.

“Nó giống như việc bạn có vài giờ để phỏng vấn Einstein và sau đó bước ra với gần như cùng mức độ hiểu biết về vật lý như ông ấy”, ông Ali Ghodsi - CEO công ty quản lý dữ liệu Databricks, nhận xét trên WSJ.

Các mô hình AI hàng đầu từ OpenAI hay Anthropic thường tự học từ đầu với khối lượng dữ liệu khổng lồ. Quá trình này kéo dài nhiều tháng và tiêu tốn hàng chục triệu USD. Nhưng với phương pháp distillation, một mô hình có thể đạt chất lượng gần tương đương chỉ trong vài tuần hoặc thậm chí vài ngày, với chi phí thấp hơn đáng kể.

OpenAI cho biết họ đã thấy dấu hiệu cho thấy DeepSeek có thể đã sử dụng phương pháp này để tận dụng các mô hình AI đứng sau ChatGPT nhằm phát triển hệ thống của mình. OpenAI quy định rõ rằng không được sử dụng AI của họ để tạo ra các sản phẩm cạnh tranh.

Trong hơn hai năm qua, kể từ khi ChatGPT xuất hiện, giới đầu tư tin rằng AI muốn phát triển mạnh mẽ sẽ cần những con chip tiên tiến nhất từ Nvidia và các công ty lớn. Tuy nhiên, DeepSeek cho thấy có thể tạo ra mô hình AI mạnh với phần cứng đơn giản hơn và chi phí thấp hơn.

Cụ thể, theo cập nhật mới nhất từ báo cáo của SemiAnalysis, công ty nghiên cứu về chip, cho biết chi phí phần cứng của DeepSeek vượt 500 triệu USD trong suốt quá trình hoạt động. Ngoài ra, công ty còn phải chi nhiều cho nghiên cứu, vận hành và tạo dữ liệu tổng hợp để huấn luyện AI.

Tuy vậy, con số này vẫn thấp hơn rất nhiều số tiền hàng chục tỷ USD đổ vào OpenAI hay Meta. Tuần trước, OpenAI hợp tác với SoftBank và một số đối tác khác để đầu tư 500 tỷ USD vào hạ tầng AI trong 5 năm tới, theo WSJ.

Nhà đầu tư lo ngại trước thông tin này và đã bán tháo cổ phiếu Nvidia. Đỉnh điểm là vào ngày 27/1, giá cổ phiếu công ty giảm 17%, khiến Nvidia mất 589 tỷ USD vốn hóa thị trường - mức giảm kỷ lục. 

Tại Việt Nam, kết phiên giao dịch trong ngày đầu năm mới (3/2), cổ phiếu FPT cũng bị bán tháo, thị giá giảm 5,2% xuống 145.500 đồng/cổ phiếu. Pha giảm mạnh kéo vốn hóa của tập đoàn FPT “bốc hơi” hơn 11.600 tỷ đồng chỉ sau một phiên giao dịch.

Có thể thấy thành công của DeepSeek khiến nhà đầu tư đặt câu hỏi về số tiền khổng lồ mà các tập đoàn công nghệ đang đổ vào AI.

Đức Huy