|
 Thuật ngữ VietnamBiz
Kinh doanh

DeepSeek của Trung Quốc là gì và tại sao nó khiến thế giới AI hoảng sợ?

08:14 | 30/01/2025
Chia sẻ
DeepSeek đang làm rung chuyển thế giới AI với mô hình chi phí thấp, hiệu suất cao, thách thức các gã khổng lồ công nghệ và đặt ra nhiều câu hỏi về tương lai của trí tuệ nhân tạo.

DeepSeek là gì?

DeepSeek là một công ty AI của Trung Quốc, mới thành lập hơn một năm. Dù còn non trẻ, nó đã gây chú ý và lo ngại ở Silicon Valley. DeepSeek giới thiệu các mô hình AI có hiệu suất ngang tầm những chatbot hàng đầu thế giới nhưng với chi phí phát triển thấp hơn nhiều.

Sự xuất hiện của DeepSeek thách thức quan điểm rằng AI trong tương lai sẽ cần ngày càng nhiều sức mạnh tính toán và năng lượng.

Ngày 27/1, cổ phiếu công nghệ toàn cầu sụt giảm. Sự quan tâm đến DeepSeek ngày càng lớn, khiến nhà đầu tư lo lắng về tác động của nó đối với các công ty Mỹ và các nhà cung cấp phần cứng AI như Nvidia.

DeepSeek là một công ty AI của Trung Quốc, mới thành lập hơn một năm. (Ảnh: Reuters).

DeepSeek được thành lập năm 2023 bởi Lương Văn Phong, giám đốc quỹ đầu tư AI High-Flyer. Công ty phát triển các mô hình AI mã nguồn mở. Điều này cho phép cộng đồng lập trình viên kiểm tra và cải tiến phần mềm. Ứng dụng di động của DeepSeek nhanh chóng đứng đầu bảng xếp hạng tải xuống trên iPhone tại Mỹ sau khi ra mắt vào đầu tháng 1.

Ứng dụng này khác với ChatGPT của OpenAI ở chỗ nó giải thích lý do trước khi đưa ra câu trả lời. DeepSeek cho biết phiên bản R1 của họ có hiệu suất ngang ngửa ChatGPT mới nhất. Họ cũng cung cấp giấy phép phát triển chatbot dựa trên công nghệ này với giá thấp hơn đáng kể so với OpenAI.

DeepSeek khác gì với ChatGPT và Meta AI?

DeepSeek cho biết R1 có hiệu suất ngang bằng hoặc vượt trội so với các mô hình đối thủ trên nhiều bảng đánh giá quan trọng. Nó đạt kết quả cao trên AIME 2024 cho bài toán, MMLU cho kiến thức tổng quát và AlpacaEval 2.0 cho khả năng hỏi đáp. R1 cũng nằm trong nhóm dẫn đầu trên bảng xếp hạng Chatbot Arena do UC Berkeley quản lý.

Công ty chưa công bố chi tiết, nhưng chi phí đào tạo và phát triển các mô hình của DeepSeek có vẻ chỉ bằng một phần nhỏ so với OpenAI hay Meta. Hiệu suất cao và chi phí thấp của R1 đặt ra câu hỏi về việc có cần đầu tư hàng tỷ USD để mua các bộ tăng tốc AI mạnh nhất từ Nvidia hay không. Nó cũng làm dấy lên tranh cãi về lệnh cấm xuất khẩu chip tiên tiến của Mỹ sang Trung Quốc. Những hạn chế này nhằm ngăn chặn các đột phá công nghệ, nhưng DeepSeek có thể đã tìm ra cách vượt qua rào cản đó.

DeepSeek bắt đầu bị để ý từ khi nào?

DeepSeek đã được giới công nghệ theo dõi sát sao từ khi ra mắt mô hình AI đầu tiên vào năm 2023. Đến tháng 11, công ty giới thiệu DeepSeek R1, một mô hình tư duy mô phỏng cách con người suy nghĩ. Mô hình này là nền tảng cho chatbot của DeepSeek, một lựa chọn rẻ hơn nhiều so với OpenAI. Nhà đầu tư Marc Andreessen gọi đây là “khoảnh khắc Sputnik của AI”.

Tính đến ngày 25/1, ứng dụng DeepSeek đã có 1,6 triệu lượt tải xuống. Nó đứng đầu bảng xếp hạng App Store trên iPhone tại Australia, Canada, Trung Quốc, Singapore, Mỹ và Anh, theo dữ liệu từ App Figures.

Phản ứng từ thị trường với DeepSeek

Trong hơn hai năm qua, kể từ khi ChatGPT xuất hiện, giới đầu tư tin rằng AI muốn phát triển mạnh mẽ sẽ cần những con chip tiên tiến nhất từ Nvidia và các công ty lớn.

Tuy nhiên, DeepSeek cho thấy có thể tạo ra mô hình AI mạnh với phần cứng đơn giản hơn và chi phí thấp hơn.

Nhà đầu tư lo ngại trước thông tin này và đã bán tháo cổ phiếu Nvidia. Ngày 27/1, giá cổ phiếu công ty giảm 17%, khiến Nvidia mất 589 tỷ USD vốn hóa thị trường - mức giảm kỷ lục. Các công ty sản xuất chip AI tiên tiến như ASML Holding NV cũng chịu ảnh hưởng.

Thành công của DeepSeek khiến nhiều người đặt câu hỏi về số tiền khổng lồ mà Meta và Microsoft đang đầu tư vào AI. Cả hai công ty đều cam kết chi hơn 65 tỷ USD trong năm nay, chủ yếu cho hạ tầng AI.

Cổ phiếu của Meta và Microsoft cũng giảm nhưng nhẹ hơn Nvidia. Nhà đầu tư cân nhắc khả năng cắt giảm chi phí AI trong tương lai. Meta thậm chí phục hồi và kết thúc phiên với mức tăng. Trong khi đó, cổ phiếu của một số công ty Trung Quốc có liên quan đến DeepSeek, như Iflytek Co., lại tăng mạnh.

Một số chuyên gia cho rằng DeepSeek có thể mang lại lợi ích chung cho ngành AI. Nếu OpenAI và các công ty Mỹ buộc phải giảm giá, AI có thể được ứng dụng rộng rãi hơn với tốc độ nhanh hơn.

DeepSeek tác động thế nào tới cuộc đua AI?

AI là lĩnh vực cạnh tranh quan trọng giữa Mỹ và Trung Quốc. Washington đã cấm xuất khẩu các chip xử lý đồ họa cao cấp sang Trung Quốc để làm chậm bước tiến công nghệ của nước này.

Tuy nhiên, DeepSeek cho thấy các kỹ sư AI Trung Quốc đã tìm ra cách vượt qua những hạn chế đó. Họ tập trung vào việc tối ưu hóa hiệu suất với nguồn lực hạn chế. Dù vậy, vẫn chưa rõ DeepSeek có thể tiếp cận bao nhiêu phần cứng AI tiên tiến.

Hiện tại, nhiều nhà phát triển trên thế giới đang thử nghiệm phần mềm của DeepSeek và tìm cách xây dựng các công cụ mới dựa trên nó. Điều này có thể giúp các công ty Mỹ nâng cao hiệu suất AI và đẩy nhanh quá trình ứng dụng AI tiên tiến.

Sự phát triển này có thể khiến các cơ quan quản lý phải đặt ra quy tắc về cách sử dụng AI và mục đích của nó.

Một câu hỏi quan trọng khác là liệu dữ liệu thu thập và lưu trữ trên máy chủ ở Trung Quốc có gây rủi ro về quyền riêng tư và an ninh cho công dân Mỹ hay không.

Tuy nhiên, vì DeepSeek là mã nguồn mở, người dùng ở Mỹ có thể tải mã nguồn về và vận hành mô hình mà không cần kết nối với máy chủ Trung Quốc.

Ai là người tạo ra DeepSeek?

Lương Văn Phong sinh năm 1985 tại Quảng Đông. Anh chưa từng học tập hay làm việc bên ngoài Trung Quốc. Anh tốt nghiệp cử nhân và thạc sĩ ngành kỹ thuật điện tử và thông tin tại Đại học Chiết Giang. Theo dữ liệu từ Tianyancha, anh thành lập DeepSeek với số vốn đăng ký 10 triệu nhân dân tệ (1,4 triệu USD).

Trong một cuộc phỏng vấn với trang tin 36kr, anh cho biết trở ngại lớn nhất không phải là vốn đầu tư mà là lệnh hạn chế của Mỹ đối với các chip tiên tiến. Anh nói hầu hết các nhà nghiên cứu hàng đầu của DeepSeek đều là sinh viên mới tốt nghiệp từ các trường đại học hàng đầu Trung Quốc. 

Anh nhấn mạnh Trung Quốc cần xây dựng hệ sinh thái công nghệ riêng, giống như hệ sinh thái của Nvidia và các chip AI của họ.

“Đầu tư nhiều không có nghĩa là đổi mới nhiều. Nếu thế, các công ty lớn đã kiểm soát toàn bộ sự đổi mới”, anh nói.

Anh thường được so sánh với Sam Altman, nhà sáng lập OpenAI, nhưng ít xuất hiện trước công chúng và rất kín tiếng.

Những thiếu sót của DeepSeek

Các tập đoàn công nghệ lớn của Trung Quốc như Alibaba, Baidu và Tencent đã đầu tư mạnh vào AI, tập trung vào việc mua sắm phần cứng và thu hút người dùng. Cùng với startup 01.AI của Kai-Fu Lee, DeepSeek nổi bật nhờ mô hình mã nguồn mở. Cách tiếp cận này giúp công ty nhanh chóng thu hút đông đảo người dùng trước khi tìm cách kiếm tiền từ nền tảng đó.

Nhờ chi phí thấp, DeepSeek đã góp phần kéo giá AI xuống, đặc biệt tại Trung Quốc. Các công ty lớn đã cạnh tranh gay gắt bằng nhiều đợt giảm giá liên tục trong suốt một năm rưỡi qua.

Giống như các mô hình AI khác tại Trung Quốc, DeepSeek có cơ chế kiểm duyệt nội dung. Nó từ chối trả lời về các chủ đề nhạy cảm. 

Sự gia tăng đột ngột của người dùng có thể gây áp lực lên hệ thống đám mây của DeepSeek. Ngày 27/1, công ty đã gặp sự cố gián đoạn lớn. Khi số lượng truy vấn tiếp tục tăng, DeepSeek sẽ cần tìm cách quản lý lưu lượng truy cập hiệu quả hơn.

Đức Huy