Điểm khác nhau giữa PhởGPT và ViGPT khi cả hai đều do Vingroup phát triển?
Ngày 27/12, VinBigdata thuộc Vingroup chính thức đưa vào hoạt động ứng dụng ViGPT - phiên bản ChatGPT đầu tiên ở Việt Nam mở cho người dùng cuối. Theo giới thiệu, đây là chatbot sở hữu khả năng sáng tạo nội dung, tìm kiếm, tổng hợp, trích xuất thông tin, giải đáp các câu hỏi thường thức và được tối ưu cho ngôn ngữ tiếng Việt.
Trước đó, một đơn vị khác cũng thuộc Vingroup là VinAI đã ra mắt mô hình "PhởGPT".
Vậy điểm khác biệt giữa ViGPT và PhởGPT là gì?
Theo ông Nguyễn Kim Anh, Giám đốc Sản phẩm của VinBigdata cho biết:
"Cả hai đều là mô hình ngôn ngữ lớn. Trong khi, PhởGPT là một mã nguồn mở hay có thể hiểu đơn giản là công nghệ lõi phục vụ cho các kỹ sư công nghệ, nhóm phát triển phần mềm, còn ViGPT là ứng dụng tập trung vào ngôn ngữ tiếng Việt, phục vụ người dùng cuối".
Điểm khác biệt và là lợi thế nổi trội của ViGPT so với các ứng dụng khác đã ra mắt là thông tin tập trung vào các lĩnh vực đặc thù của Việt Nam như pháp luật, lịch sử, văn hóa, danh nhân, danh lam thắng cảnh, đặc trưng vùng miền…, khắc phục những hạn chế của các ứng dụng như ChatGPT (OpenAI) hay Bard (Google) về ngôn ngữ tiếng Việt.
Với việc làm chủ từ những tầng lõi mô hình sâu nhất cho tới phát triển ứng dụng dành cho người dùng cuối của VinBigdata, ViGPT sở hữu hơn 600GB dữ liệu tiếng Việt tinh chỉnh lấy từ nhiều lĩnh vực. Thông số này cao hơn so với mức 570GB dữ liệu của ChatGPT phiên bản GPT 3.5, tức bản miễn phí.
Hiện nay, VinBigdata cũng đang ứng dụng công nghệ trên trong các sản phẩm ra mắt gần đây như trợ lý ảo pháp lý cho người dân của cơ quan nhà nước và sản phẩm sắp ra mắt trong thời gian tới là trợ lý ảo ViVi tích hợp AI tạo sinh trên xe điện VinFast.
Trước đó, hồi đầu tháng 12, tại Ngày Trí tuệ nhân tạo (AI Day 2023), VinAI đã cho ra mắt nền tảng chatbot tiếng Việt có tên gọi là PhởGPT. Phía VinAI cho rằng việc thiếu một bộ mã nguồn mở cho mô hình ngôn ngữ tiếng Việt làm giảm khả năng sáng tạo, cũng như tạo ra nhiều nghi ngại về tính bảo mật khi phải sử dụng phần mềm của nhà cung cấp.
AI tạo sinh (Generative AI) được coi là thế hệ tiếp theo của trí tuệ nhân tạo, tập trung vào việc tạo ra nội dung, giải pháp hoặc ý tưởng mới, thay vì chỉ phân tích dữ liệu như hiện tại. Để làm chủ AI tạo sinh hoàn toàn từ tầng lõi sâu nhất, các doanh nghiệp cần xây dựng và huấn luyện mô hình ngôn ngữ lớn từ những bước sơ khai.
Theo đó, mô hình sẽ được đào tạo trên tập dữ liệu lớn để ghi nhớ các quy luật và cấu trúc ngôn ngữ. Qua giai đoạn đào tạo, mô hình bắt đầu rút ra mối quan hệ giữa các từ, cụm từ, câu và các khái niệm khác nhau và sau đó tiếp tục được tinh chỉnh qua nhiều bước để tạo ra nền tảng phát triển các ứng dụng thực tế của AI tạo sinh.
Hiện nay, các đơn vị nghiên cứu và phát triển AI tạo sinh trên thế giới thường cung cấp sản phẩm theo một số hình thức như mã nguồn mở (open source), mã nguồn đóng (closed source) hoặc mã nguồn đóng nhưng có sẵn qua API (APIs) và ứng dụng cho người dùng cuối (application).
Với các mã nguồn mở như LLaMA (Meta), mô hình được công khai để các nhà phát triển/cộng đồng có thể tải xuống sử dụng, chỉnh sửa và tùy biến. Ngược lại, các mã nguồn đóng thường không công khai hoặc cung cấp qua giao thức kết nối (APIs) như GPT-4 (OpenAI) cho phép doanh nghiệp tích hợp phần lõi công nghệ này vào sản phẩm riêng.
Ứng dụng như ChatGPT hay Bard là sản phẩm được hoàn thiện cho người dùng cuối có thể dễ dàng truy cập/cài đặt và sử dụng luôn các tác vụ cụ thể. Với tầm nhìn tạo ra công cụ cho người Việt, VinBigdata đưa ra một mô hình tinh gọn hơn, chỉ khoảng 1,6 tỷ tham số nhỏ hơn rất nhiều và tập trung nhiều hơn trong việc phục vụ doanh nghiệp trong nước với chi phí hợp lý.
Nếu so sánh về sức mạnh, ViGPT kém hơn so với PhởGPT (7,5 tỷ tham số), chưa kể đến những ứng dụng mạnh mẽ như Bard (bản miễn phí vận hành với 1,56 nghìn tỷ tham số) hoặc ChatGPT (bản miễn phí GPT 3.5 là 1,37 nghìn tỷ tham số).
Nói về điều này, ông Nguyễn Kim Anh cho biết theo công bố của OpenAI, công ty này đang tiêu tốn khoảng 700.000 đến một triệu USD/ngày để vận hành ChatGPT.
"Đối với doanh nghiệp trong nước thì rất khó để có thể tự triển khai mô hình ngôn ngữ lớn với cái giá như vậy. Do đó, chúng tôi tạo ra một mô hình nhỏ hơn rất nhiều, tối ưu chi phí thấp hơn so với ChatGPT. Không có gì đảm bảo rằng sau này họ sẽ tiếp tục miễn phí cho người dùng, đặc biệt là đối tượng doanh nghiệp", ông Nguyễn Kim Anh cho biết. Ngoài ra, VinBigdata sẽ cung cấp dịch vụ theo từng nhu cầu và ngân sách của doanh nghiệp cho mô hình ngôn ngữ lớn.