Chi phí lớn có thể ngăn đà phát triển của ChatGPT và các công cụ trí tuệ nhân tạo
Trước khi ChatGPT xuất hiện và thu hút sự chú ý của thế giới nhờ, một công ty khởi nghiệp nhỏ có tên Latitude đã khiến người chơi kinh ngạc với trò chơi AI Dungeon cho phép họ sử dụng trí tuệ nhân tạo để tạo ra những câu chuyện giả tưởng dựa trên chính kịch bản do họ tạo ra, theo CNBC.
Tuy nhiên, khi AI Dungeon trở nên phổ biến hơn, CEO Latitude, Nick Walton, nhớ lại rằng chi phí để duy trì trò chơi này bắt đầu tăng vọt. Phần mềm tạo văn bản của AI Dungeon được cung cấp bởi công nghệ ngôn ngữ GPT do OpenAI, đơn vị được gã khổng lồ Microsoft hậu thuẫn. Càng nhiều người chơi AI Dungeon, hóa đơn mà Latitude phải trả cho OpenAI càng lớn.
Vào đợt cao điểm năm 2021, Walton ước tính Latitude đã chi gần 200.000 USD mỗi tháng cho cái gọi là phần mềm AI tổng quát của OpenAI và Dịch vụ web của Amazon để theo kịp hàng triệu truy vấn của người dùng mà tựa game cần xử lý mỗi ngày.
Walton cho biết vào cuối năm 2021, Latitude chuyển từ sử dụng phần mềm GPT của OpenAI sang một phần mềm ngôn ngữ rẻ hơn, do công ty khởi nghiệp AI21 Labs cung cấp, đồng thời cho biết thêm rằng công ty khởi nghiệp này cũng đã kết hợp các mô hình ngôn ngữ miễn phí và mã nguồn mở vào dịch vụ của mình để giảm chi phí.
Walton cho biết, hóa đơn AI của Latitude khi đó đã giảm xuống dưới 100.000 USD mỗi tháng và startup này cũng tính phí với người chơi đăng ký hàng tháng cho các tính năng AI nâng cao hơn để giúp giảm thiểu chi phí.
Vấn đề của Latitude nhấn mạnh một sự thật đằng sau sự bùng nổ gần đây của các công nghệ AI tổng quát: Chi phí để phát triển và duy trì phần mềm có thể cực kỳ cao, cả đối với các công ty phát triển các công nghệ cơ bản, thường được gọi là ngôn ngữ lớn hoặc các mô hình nền tảng.
Chi phí máy học (Machine Learning) cao là một thực tế không dễ chấp nhận trong ngành khi các nhà đầu tư mạo hiểm để mắt đến các công ty có khả năng đạt giá trị vốn hóa tỷ USD. Các công ty lớn như Microsoft, Meta, Google,… đã sử dụng nguồn vốn khổng lồ của họ để duy trì vị trí dẫn đầu trong ngành công nghệ mà những đối thủ nhỏ hơn không thể bắt kịp.
Tuy nhiên, nếu tỷ suất lợi nhuận cho các ứng dụng AI vĩnh viễn nhỏ hơn so với tỷ suất lợi nhuận của phần mềm dưới dạng dịch vụ trước đây, do chi phí điện toán cao, thì điều đó có thể cản trở sự bùng nổ hiện tại của AI.
Nvidia, nhà sản xuất hầu hết các GPU cho ngành công nghiệp AI và con chip dành cho trung tâm dữ liệu chính của nó có giá 10.000 USD. Các nhà khoa học xây dựng những mô hình này thường nói đùa rằng họ đang “làm tan chảy GPU”.
Mô hình đào tạo
Các nhà phân tích ước tính rằng quy trình để đào tạo một mô hình ngôn ngữ lớn như GPT-3 của OpenAI có thể tiêu tốn hơn 4 triệu USD. Rowan Curran, một nhà phân tích của Forrester, người tập trung vào AI và máy học, cho biết các mô hình ngôn ngữ tiên tiến hơn có thể tốn “hàng triệu USD” để đào tạo.
Clement Delangue, CEO Startup AI Hugging Face, cho biết quá trình đào tạo mô hình ngôn ngữ lớn Bloom của công ty mất hơn hai tháng rưỡi và yêu cầu quyền truy cập vào một siêu máy tính “tương đương với 500 GPU”.
Ông nói, các tổ chức xây dựng các mô hình ngôn ngữ lớn phải thận trọng khi họ đào tạo lại phần mềm, giúp cải thiện khả năng của nó, bởi vì nó rất tốn kém. “Chúng tôi thực sự đang tiến hành đào tạo ngay bây giờ cho phiên bản hai của Bloom và tiêu tốn tối đa 10 triệu USD để đào tạo lại. Vì vậy, đó là điều mà chúng tôi không muốn phải làm mỗi tuần”, ông Delangue chia sẻ.
Mô hình suy luận
Để sử dụng một mô hình máy học đã được đào tạo và đưa ra dự đoán hoặc tạo văn bản, các kỹ sư sử dụng mô hình này trong một quy trình gọi là “suy luận”, quy trình này có thể tốn kém hơn nhiều so với “đào tạo” vì có thể cần chạy hàng triệu lần cho một sản phẩm phổ biến.
Đối với một sản phẩm phổ biến như ChatGPT, các chuyên gia tin rằng OpenAI có thể tiêu tốn 40 triệu USD để xử lý hàng triệu lời nhắc mà mọi người đưa vào phần mềm trong một tháng.
Chi phí tăng vọt khi những công cụ này được sử dụng hàng tỷ lần mỗi ngày. Các nhà phân tích tài chính ước tính chatbot Bing AI của Microsoft, được cung cấp bởi mô hình OpenAI ChatGPT, cần ít nhất 4 tỷ USD cơ sở hạ tầng để phục vụ phản hồi cho tất cả người dùng Bing.
Để gieo mầm cho sự bùng nổ hiện nay của AI, các nhà đầu tư mạo hiểm và những gã khổng lồ công nghệ đã đầu tư hàng tỷ USD vào các công ty khởi nghiệp chuyên về công nghệ AI tổng hợp. Chẳng hạn, Microsoft đã đầu tư tới 10 tỷ USD vào OpenAI, theo báo cáo của các phương tiện truyền thông. Chi nhánh đầu tư mạo hiểm của Salesforce, Salesforce Ventures gần đây cũng đã ra mắt một quỹ trị giá 250 triệu USD nhằm phục vụ cho các công ty khởi nghiệp AI sáng tạo.
Nhiều doanh nhân nhận thấy rủi ro khi chi phí vận hành các mô hình ngôn ngữ lớn bắt đầu tăng cao. “Khi tôi nói chuyện với những người bạn của mình tại các hội nghị khởi nghiệp, đây là điều tôi nói với họ: Đừng chỉ phụ thuộc vào OpenAI, ChatGPT hoặc bất kỳ mô hình ngôn ngữ lớn nào khác bởi vì các mô hình kinh doanh luôn thya đổi. Nếu bạn phụ thuộc vào một công nghệ, và khi công nghệ đó bị cắt quyền truy cập, bạn cũng sẽ “biến mất”, Suman Kanuganti, người sáng lập personal.ai, chia sẻ.
Làm thế nào để thay đổi?
Hiện tại, chưa rõ liệu chi phí để phát triển AI có tiếp tục đắt đỏ hay không khi ngành này không ngừng phát triển. Các công ty sản xuất mô hình nền tảng, nhà sản xuất chất bán dẫn và công ty khởi nghiệp đều nhìn thấy cơ hội kinh doanh trong việc giảm giá chạy phần mềm AI.
Nvidia, công ty chiếm khoảng 95% thị trường chip AI, tiếp tục phát triển các phiên bản chip có hiệu suất mạnh mẽ hơn được thiết kế dành riêng cho máy học, nhưng những cải tiến về tổng sức mạnh chip trong toàn ngành đã chậm lại trong những năm gần đây.
Tuy nhiên, CEO Nvidia Jensen Huang tin rằng trong 10 năm nữa, AI sẽ hiệu quả hơn “một triệu lần” nhờ những cải tiến không chỉ ở chip mà còn ở phần mềm và các bộ phận máy tính khác.
Một số công ty khởi nghiệp đã tập trung vào chi phí cao của AI như một cơ hội kinh doanh. Chẳng hạn, Sid Sheth đã sáng lập nên D-Matrix, một công ty khởi nghiệp xây dựng hệ thống tiết kiệm tiền cho khả năng “suy luận” của AI bằng cách xử lý nhiều hơn trong bộ nhớ của máy tính, trái ngược với trên GPU.
“Ngày nay, mọi người đang sử dụng GPU NVIDIA để thực hiện hầu hết suy luận của họ. Họ mua các hệ thống DGX mà NVIDIA bán với giá rất cao. Vấn đề với “suy luận” là nếu khối lượng công việc tăng đột biến rất nhanh, không có cách nào dung lượng GPU của bạn có thể theo kịp điều đó bởi vì nó không được chế tạo cho điều đó. Nó được xây dựng để đào tạo, để tăng tốc đồ họa”, anh nói.
Delangue, CEO HuggingFace, tin rằng nhiều công ty sẽ được phục vụ tốt hơn khi tập trung vào các mô hình cụ thể, nhỏ hơn, rẻ hơn để đào tạo cũng như vận hành, thay vì các mô hình ngôn ngữ lớn đang thu hút hầu hết sự chú ý của mọi người.
Trong khi đó, OpenAI đã thông báo vào tháng trước rằng họ đang giảm chi phí cho các công ty khi truy cập vào các mô hình GPT của mình. Hiện tại, OpenAI tính phí khoảng 0,25 cent cho khoảng 750 từ đầu ra.
Mức giá thấp hơn của OpenAI đã thu hút sự chú ý của Latitude, nhà sản xuất Dungeon AI. Người phát ngôn của Latitude cho biết: “Tôi nghĩ đó chắc chắn là một thay đổi lớn mà chúng tôi rất vui khi thấy điều này xảy ra. Chúng tôi sẽ có nhiều cơ hội hơn để mang lại trải nghiệm tốt nhất cho người dùng. Latitude sẽ tiếp tục đánh giá tất cả mô hình AI để đảm bảo rằng các tựa game của chúng tôi sẽ hoạt động tốt nhất có thể”.