|
 Thuật ngữ VietnamBiz
Kinh doanh

Việt Nam nhập cuộc đường đua phát triển AI tại châu Á

19:58 | 26/01/2024
Chia sẻ
Việt Nam vừa chính thức bước vào cuộc đua phát triển các chương trình trí tuệ nhân tạo tạo sinh (AI generative) phục vụ ngôn ngữ và văn hóa bản địa, đồng thời giảm phụ thuộc vào dịch vụ do các tập đoàn công nghệ Mỹ cung cấp.

Trong một bài viết được đăng tải trên Nikkei Asia, tờ báo Nhật đã đưa ra dẫn chứng từ công cụ AI tạo sinh do hai đơn vị thành viên của tập đoàn Vingroup là VinBigdata và VinAI phát triển, nhằm bổ sung cho nhận định đội ngũ kỹ sư, chuyên gia công nghệ của Việt Nam đã sẵn sàng cho cuộc chơi trí tuệ nhân tạo toàn cầu.

Theo đó, trong buổi ra mắt trực tuyến diễn ra vào tháng trước, công cụ chatbot tiếng Việt ViGPT do VinBigdata trình làng đã khiến khán giả ngạc nhiên khi tự tin sửa lỗi chính tả và cung cấp thông tin chính xác.

"Cách phát âm của bạn chưa chính xác," ViGPT nói với một người cố tình đưa ra thông tin sai. Trong một thử nghiệm khác, chương trình trả lời: "Tên phổ biến nhất ở Việt Nam là 'Anh', không phải 'Hiền'."

 Trải nghiệm ViGPT. (Ảnh: Thành Vũ).

ViGPT được phát triển với mục tiêu chính là tạo ra một chương trình có thể tương tác với người dùng bằng tiếng Việt. ViGPT được cho là chương trình AI Generative (AI tạo sinh) do Việt Nam tự phát triển đầu tiên được cung cấp cho công chúng.

Theo ước tính của Bloomberg Intelligence, thị trường AI Generative toàn cầu đang mở rộng với tốc độ 42% mỗi năm. Dự kiến, thị trường này sẽ đạt giá trị 1,3 nghìn tỷ USD vào năm 2032, gấp 32 lần so với quy mô 40 tỷ USD của năm 2022.

Hiện tại, các công ty công nghệ Mỹ như OpenAI, Google và Amazon.com đang dẫn đầu cuộc đua này nhờ nguồn tài chính và nguồn nhân lực dồi dào. Nhiều công ty trên thế giới sử dụng ChatGPT và các công cụ tiên tiến khác được phát triển tại Mỹ.

Mặc dù phải đối mặt với sự cạnh tranh mạnh mẽ, Vingroup vẫn quyết định tự phát triển phiên bản AI Generative của riêng mình. Giáo sư Vũ Hà Văn, Giám đốc Khoa học của VinBigdata, cho biết công ty có thể tận dụng dữ liệu tiếng Việt để tạo ra AI Generative có độ chính xác cao hơn so với các đối thủ nước ngoài.

Nhiều chương trình AI Generative được đào tạo trên dữ liệu tiếng Anh. Điều đó có nghĩa là nguồn dữ liệu tiếng Việt tương đối ít ỏi, khiến độ chính xác của các chương trình đó giảm đi khi liên quan đến văn hóa, lịch sử và luật pháp của Việt Nam.

Mô hình ngôn ngữ lớn (LLM) của ViGPT được cho là hoạt động dựa trên 1,6 tỷ tham số, con số tương đối nhỏ nếu so với các mô hình nổi tiếng khác, chỉ bằng vài phần trăm so với GPT-4 của OpenAI.

Số tham số thường tương đương với mức độ thông minh. Tuy nhiên, theo đánh giá củaVietnamese Multitask Language Understanding - một tiêu chuẩn đánh giá AI Generative được tùy chỉnh cho thị trường Việt Nam, ViGPT vượt trội so với nhiều đối thủ nước ngoài và đạt điểm cao thứ hai, chỉ sau ChatGPT.

Vingroup đang áp dụng công nghệ AI vào xe điện của VinFast, cho phép người lái điều khiển xe bằng giọng nói tiếng Việt. Tập đoàn cũng có kế hoạch đưa AI vào các lĩnh vực tài chính, bảo hiểm và logistics.

Ước tính chỉ khoảng 5% dân số thế giới nói tiếng Anh như ngôn ngữ mẹ đẻ, điều này cho thấy nhu cầu tiềm ẩn lớn đối với AI được phát triển cho những người nói tiếng Anh không phải là tiếng mẹ đẻ.

Tại Nhật Bản, các công ty cũng đang phát triển AI Generative tiếng Nhật. Vào tháng 8, tập đoàn điện tử NEC đã ra mắt một dịch vụ sử dụng LLM cotomi. Công ty viễn thông NTT sẽ bắt đầu cung cấp dịch vụ vào tháng 3 dựa trên một LLM khác có tên làtsuzumi. Cả hai mô hình này đều thể hiện hiệu suất cao trong ngôn ngữ Nhật Bản.

Nhà mạng di động SoftBank Corp của Nhật Bản cũng đang phát triển LLM của riêng mình. Chủ tịch SoftBank Junichi Miyakawa cho biết: "Hiểu được các hoạt động kinh doanh của Nhật Bản mang lại lợi thế về khả năng sử dụng, chẳng hạn như khả năng trả lời email và thực hiện công việc tổng đài theo cách tự nhiên hơn."

Bên cạnh nhu cầu về các công cụ AI hiểu và đáp ứng ngôn ngữ, văn hóa bản địa, cuộc đua phát triển AI Generative còn được thúc đẩy bởi những rủi ro tiềm ẩn khi phụ thuộc quá nhiều vào các nước khác, đặc biệt là Mỹ. Điều này liên quan đến cả khả năng cạnh tranh quốc tế và an ninh quốc gia.

Ngoài ra, việc sử dụng các chương trình AI phát triển ở nước ngoài còn có nguy cơ xảy ra rò rỉ dữ liệu, ảnh hưởng đến thông tin nhạy cảm.

Ông Vũ Hà Văn là một người ủng hộ mạnh mẽ việc Việt Nam tự phát triển AI Generative. Ông cho rằng công nghệ này không nên phụ thuộc vào các công ty nước ngoài, đặc biệt trong bối cảnh sinh viên ngày càng sử dụng AI trong học tập. Sự phát triển của AI sẽ có ảnh hưởng lớn đến thế hệ trẻ, do đó việc sở hữu công nghệ nội địa đóng vai trò quan trọng.

Tại Trung Quốc, Tencent và Alibaba đều đang tích cực nghiên cứu phát triển AI Generative. Ernie Bot của Baidu, tính đến cuối năm ngoái, đã thu hút hơn 100 triệu người dùng.

"Mô hình ngôn ngữ lớn mà chúng tôi đang phát triển sẽ phù hợp hơn với ngôn ngữ và thị trường Trung Quốc," Chủ tịch kiêm Giám đốc điều hành Baidu Robin Li cho biết.

Tháng 8 năm ngoái, công ty dịch vụ mạng Naver của Hàn Quốc đã ra mắt HyperClova X - một AI Generative được tùy chỉnh cho ngôn ngữ Hàn Quốc. Chương trình này sẽ được tích hợp với công cụ tìm kiếm và nền tảng mua sắm trực tuyến của công ty, giúp người dùng tìm kiếm kết quả hiệu quả hơn.

Naver cho biết cơ sở dữ liệu tiếng Hàn của họ lớn hơn dữ liệu tiếng Hàn của ChatGPT 6.500 lần, cho phép tạo ra văn bản đọc tự nhiên hơn và nhận dạng ngôn ngữ mượt mà hơn.

Tháng trước, Singapore công bố kế hoạch phát triển một LLM phù hợp với các ngôn ngữ Indonesia, Mã Lai và Thái. Tuy nhiên, những sáng kiến ​​này sẽ phải đối mặt với những thách thức như thiếu dữ liệu huấn luyện cho các ngôn ngữ ít phổ biến và tính khả thi về mặt lợi nhuận.

Cuộc đua phát triển AI Generative không chỉ là về công nghệ, mà còn là về độc lập và an ninh quốc gia. Các quốc gia đang nỗ lực tạo ra các công cụ AI hiểu ngôn ngữ, văn hóa của mình, đồng thời giảm thiểu phụ thuộc vào các nước khác. 

Thành Vũ