Cơn sốt DeepSeek khiến nhân tài IT Trung Quốc bỏ vọng tưởng giấc mơ Mỹ với Thung lũng Silicon
Cuối kỳ thực tập tại Nvidia năm 2023, Zizheng Pan, một nhà nghiên cứu trẻ về trí tuệ nhân tạo người Trung Quốc, đứng trước một quyết định quan trọng: tiếp tục ở lại Thung lũng Silicon cùng các chuyên gia thiết kế chip hàng đầu thế giới hay trở về quê nhà để gia nhập DeepSeek, khi đó vẫn là một startup ít tên tuổi ở miền đông Trung Quốc.
Pan không do dự nhiều và chọn DeepSeek. Zhiding Yu, một nhà nghiên cứu cao cấp tại Nvidia và là người hướng dẫn Pan trong kỳ thực tập, đã chia sẻ trên X tháng trước: “Tôi vẫn rất ấn tượng”. Ông cũng cho biết ngày càng có nhiều trường hợp tương tự. “Nhiều tài năng xuất sắc đến từ Trung Quốc, và họ không nhất thiết phải thành công ở một công ty Mỹ”.
Chưa đầy hai năm sau, DeepSeek bất ngờ nổi tiếng toàn cầu. Công ty này ra mắt hai mô hình AI tiên tiến với chi phí phát triển thấp, khiến thị trường phản ứng mạnh. Giá trị vốn hóa của Nvidia giảm gần 600 tỷ USD sau tin tức này.

Nhà nghiên cứu Junxiao Song của DeepSeek (bên phải) trong buổi bảo vệ luận án tiến sĩ ngành kỹ thuật điện tử và máy tính cùng giáo sư hướng dẫn Daniel Palomar vào tháng 7/2015. (Ảnh: Nhân vật cung cấp).
Quyết định của Pan phản ánh xu hướng ngày càng phổ biến trong giới AI Trung Quốc. Nhiều người từ chối cơ hội làm việc tại Thung lũng Silicon để quay về nước. Trung Quốc mang đến chi phí sinh hoạt thấp hơn, gần gũi với gia đình và cơ hội đảm nhận vai trò quan trọng từ sớm. Theo một số người trong ngành công nghệ, DeepSeek đã thu hút nhiều sinh viên tốt nghiệp và thực tập sinh từ các trường đại học hàng đầu như Thanh Hoa và Bắc Kinh.
DeepSeek là một trường hợp đặc biệt trong ngành AI Trung Quốc. Công ty được tài trợ hoàn toàn bởi High-Flyer, quỹ đầu tư của nhà sáng lập Liang Wenfeng. Đội ngũ trẻ và nhiệt huyết của DeepSeek đang nỗ lực bắt kịp các tập đoàn công nghệ lớn từ Thung lũng Silicon, bất chấp những hạn chế từ Mỹ đối với ngành chip Trung Quốc.
“DeepSeek cho thấy Trung Quốc có một đội ngũ nhân tài AI mạnh mẽ, với rất nhiều kỹ sư phần mềm giỏi và giàu kinh nghiệm”, Angela Zhang, giáo sư tại Đại học Nam California, chia sẻ với Rest of World. “Tôi tin rằng lợi thế này sẽ giúp Trung Quốc có vị trí vững chắc trong giai đoạn tiếp theo của ngành AI”.
Theo báo cáo năm 2023 của tổ chức nghiên cứu MacroPolo có trụ sở tại Chicago, gần một nửa số nhà nghiên cứu AI hàng đầu thế giới từng học đại học ở Trung Quốc. Các trường đại học Trung Quốc, phòng thí nghiệm nhà nước và trung tâm nghiên cứu của các công ty công nghệ Mỹ, như Microsoft Research Asia tại Bắc Kinh, đã đào tạo một lượng lớn chuyên gia AI trong nước.
Chẳng hạn, Junxiao Song, một trong những người đóng vai trò quan trọng trong việc phát triển mô hình R1 mới nhất của DeepSeek, từng học ngành tự động hóa tại Đại học Chiết Giang. Sau đó, anh lấy bằng tiến sĩ về kỹ thuật điện tử và máy tính tại Đại học Khoa học và Công nghệ Hong Kong vào năm 2015. Giáo sư hướng dẫn của anh, Daniel Palomar, nhận xét rằng Song rất kiên trì và có tư duy toán học mạnh mẽ.
Khi Palomar chia sẻ về công việc của Song tại DeepSeek trên LinkedIn, một cựu sinh viên đã bình luận rằng trước đây Song có biệt danh “dashi” (đại sư). “Bằng cách nào đó, DeepSeek đã thu hút được những nhân tài giỏi nhất”. Palomar nói.
Một nhà nghiên cứu AI Trung Quốc tại một công ty công nghệ lớn của Mỹ tiết lộ với Rest of World rằng các công ty Mỹ thường tuyển thực tập sinh Trung Quốc để làm việc trong các dự án AI, từ xa hoặc tại văn phòng ở Thung lũng Silicon. “Sinh viên Trung Quốc làm việc rất yên tâm”, ông nhận xét.
Tuy nhiên, nhiều người trong số họ không muốn ở lại Mỹ lâu dài. “Điều khiến tôi ngạc nhiên là ngày càng có nhiều sinh viên Trung Quốc không còn hứng thú với công việc toàn thời gian ở Mỹ”, ông nói. Những chính sách nhập cư khắt khe cũng khiến một số kỹ sư Trung Quốc từ bỏ ý định chuyển đến Mỹ trong những năm gần đây.
Trước đây, nhiều kỹ sư công nghệ Trung Quốc thích làm việc ở Thung lũng Silicon vì mức lương cao và cơ hội hợp tác với những chuyên gia hàng đầu thế giới. Nhưng ngày càng nhiều kỹ sư AI trẻ chọn ở lại quê nhà. Khi ngành AI trong nước mở rộng, họ có nhiều cơ hội hơn tại các tập đoàn lớn như Alibaba hoặc các startup như StepFun, Minimax và 01.AI.
DeepSeek có cách thu hút nhân tài rất riêng. Theo trang tin công nghệ 36Kr, công ty này trả lương cao hơn cả ByteDance. Không giống nhiều công ty công nghệ Trung Quốc khác, nơi nhân viên phải cạnh tranh nội bộ và làm việc với cường độ cao, Liang Wenfeng cho biết trong một cuộc phỏng vấn tháng 7/2024 rằng ông để nhân viên tự chọn công việc và sử dụng tài nguyên máy tính một cách tự do.
“Chúng tôi đang giải quyết những bài toán khó nhất, vì thế chúng tôi có sức hút với họ', ông nói.
Liang cũng tin rằng công khai mã nguồn giúp nhân viên cảm thấy tự hào hơn và nâng cao danh tiếng của công ty. Trong vài tuần qua, nhiều nhà nghiên cứu của DeepSeek đã thu hút hàng chục nghìn người theo dõi trên X khi họ chia sẻ về phương pháp nghiên cứu và niềm đam mê của mình.
“Không thể diễn tả bằng lời lúc này”, Deli Chen, nhà nghiên cứu tại DeepSeek, viết trên X ngày 24/1, khi mô hình R1 đạt vị trí số một trên bảng xếp hạng chatbot phổ biến. “Tất cả những gì tôi biết là chúng tôi vẫn đang tiếp tục tiến lên để đưa AGI mã nguồn mở đến với mọi người”, anh viết. Chen tốt nghiệp thạc sĩ tại Đại học Bắc Kinh năm 2021.
“Hôm nay là một khoảnh khắc đáng nhớ với tôi”, Zizheng Pan, cựu thực tập sinh tại Nvidia, chia sẻ hai ngày sau đó.
Yu Zhou, giáo sư tại Đại học Vassar, cho biết sự nhiệt huyết của các nhà nghiên cứu trẻ tại DeepSeek khiến bà nhớ đến những startup internet đầu tiên ở Bắc Kinh vào đầu những năm 2000. Khi đó, sinh viên từ các trường đại học hàng đầu Trung Quốc được truyền cảm hứng từ những công ty như Google và Microsoft. Dù có ít vốn và ít nhân tài hơn, họ vẫn xây dựng nên một ngành công nghệ trong nước.
“Mỹ nghĩ rằng Trung Quốc đang muốn vượt lên, nhưng thực tế, những người trẻ chỉ đơn giản là được truyền cảm hứng từ những tiến bộ công nghệ mới như OpenAI”, Zhou nói.
Bà cũng cho biết các doanh nhân AI ở Trung Quốc ngày nay phải đối mặt với tình trạng thiếu chip Nvidia mạnh nhất. “Khi không có đủ tài nguyên, tất cả những gì bạn có là trí tuệ của mình”.