CEO VinAI: Đội ngũ Việt Nam đủ sức làm mô hình tương tự ChatGPT
"Việt Nam thuộc top đầu Đông Nam Á về mức độ tiếp nhận trí tuệ nhân tạo, thậm chí là dẫn đầu Đông Nam Á", đây là nhận định của Tiến sĩ Bùi Hải Hưng, CEO VinAI bên lề sự kiện Ngày Trí tuệ nhân tạo 2023 (AI Day 2023) diễn ra tại TP HCM hôm 5/12.
Lần thứ 5 tổ chức, AI Day 2023 tập trung thảo luận về chủ đề AI Tạo sinh - GenAI.
Tại sự kiện lần này, VinAI ra mắt dự án AI Việt Nam có tên gọi là "PhởGPT" vào ngày 6/12. Theo ông Hưng, sự ra mắt của bộ mã nguồn mở cho mô hình ngôn ngữ lớn của VinAI là lần đầu tiên ở Đông Nam Á. Do đó, CEO VinAI hoàn toàn tự tin vào trình độ của các kỹ sư Việt Nam.
"Trên thế giới, số lượng nhân sự đủ hiểu và làm được công nghệ lõi về AI thì không có nhiều, nhưng tôi cũng rất tự hào khi lần đầu tiên, thế giới ra mắt một công nghệ như ChatGPT và đội ngũ của chúng ta có thể hiểu, đủ sức làm ra mô hình tương tự, như vậy mức độ tiếp nhận của Việt Nam rất là nhanh", Tiến sĩ Bùi Hải Hưng cho biết dự án này được VinAI phát triển từ đầu, không phải là điều chỉnh dựa trên một mô hình sẵn có.
"PhởGPT" là dự án nghiên cứu mã nguồn mở về mô hình ngôn ngữ lớn cho riêng tiếng Việt. Mục tiêu của dự án là phát triển các mô hình tương tự như ChatGPT cho tiếng Việt và văn hoá người Việt. Theo giới thiệu, PhởGPT có khả năng hiểu và viết văn phong tiếng Việt. Nguồn dữ liệu huấn luyện cho mô hình đều khả dụng trên internet.
Tiến sĩ Bùi Hải Hưng cho biết mô hình ngôn ngữ này được huấn luyện từ đầu với tập dữ liệu tiếng Việt, không phụ thuộc vào bất cứ một mô hình nào khác của thế giới, đảm bảo việc làm chủ công nghệ lõi tiên tiến cho Việt Nam. Trong tương lai, công ty sẽ tập trung tối ưu hoá những mô hình tương tự PhởGPT để tạo ra độ chính xác, nhỏ gọn và hiệu quả hơn. Từ đó, giúp giảm thiểu chi phí sản xuất mô hình trí tuệ nhân tạo.
Tuy vậy, đây là hành trình dài hơi và cũng là vấn đề chung của cộng đồng toàn cầu, do đó ông Hưng không có đặt ra thời hạn cụ thể cho mục tiêu này.
Phía VinAI cho biết khi so sánh phiên bản PhởGPT-7B5-Instruct và ChatGPT mã nguồn đóng (GPT-3.5-turbo) và các mô hình mã nguồn mở khác, kết quả cho thấy PhởGPT đứng thứ hai chỉ sau ChatGPT trong hầu hết các mục đánh giá.
Đội ngũ phát triển PhởGPT đang tiếp tục cải tiến mô hình và sẽ mở rộng dự án cho các ngôn ngữ khác, đặc biệt là các ngôn ngữ trong khu vực Đông Nam Á.
Theo ông Hưng, điểm đặc biệt nhất của PhởGPT là một mã nguồn mở, điều này mở ra cơ hội cho nhiều đơn vị khác có thể khai thác và tạo ra những phiên bản AI chuyên dụng cho người Việt.
"Chúng tôi hy vọng sẽ tận dụng nguồn lực của cộng đồng để tạo ra nhiều ứng dụng phục vụ người Việt, một mình VinAI thực sự không thể đảm đương được hết", CEO VinAI chia sẻ.
PhởGPT là một dự án mã nguồn mở (Open-source) thay vì là một phần mềm sở hữu riêng như ChatGPT của OpenAI. Điều này nghĩa là mã nguồn của PhởGPT là công khai và có sẵn cho cộng đồng người phát triển.
Bằng cách sử dụng mô hình mã nguồn mở PhởGPT, người dùng có thể phát triển các ứng dụng tùy chỉnh, đặc biệt là những ứng dụng đòi hỏi sự bảo mật cao mà không phải phụ thuộc vào API từ các phần mềm sở hữu riêng.
PhởGPT được giới thiệu là một mô hình ngôn ngữ với dữ liệu lớn có 7.5 tỷ tham số, được xây dựng trên nền tảng giải mã Transformer. Mô hình này được huấn luyện từ đầu, sử dụng những kỹ thuật tiên tiến nhất hiện có như cơ chế tập trung chớp nhoáng (Flash Attention) và ngoại suy độ dài ngữ cảnh AliBi.
Những kỹ thuật này không chỉ giúp mô hình hiểu sâu hơn về ngữ cảnh mà còn làm tăng khả năng đối thoại và tương tác tự nhiên của PhởGPT. Điều này giúp mô hình trở thành một công cụ đa nhiệm và linh hoạt, có khả năng đáp ứng đa dạng các nhu cầu ngôn ngữ của người sử dụng.
Chia sẻ tại sự kiện, ông Trần Duy Đông - Thứ trưởng Bộ Kế hoạch và đầu tư nhấn mạnh: “AI sẽ là một trong những lĩnh vực mà Việt Nam có nhiều tiềm năng để phát triển mạnh mẽ và sớm bắt kịp với trình độ của thế giới.
Bộ sẽ luôn ủng hộ và đồng hành cùng cộng đồng AI nói riêng và cộng đồng khoa học công nghệ nói chung để phát triển một hệ sinh thái đổi mới sáng tạo toàn diện, năng động, đóng góp cho sự phát triển chung của đất nước”.