OpenAI công bố các mô hình o3 mới, tiệm cận Trí tuệ nhân tạo tổng quát AGI?

Thanh Tuấn

Well-known member
OpenAI công bố các mô hình o3 mới
o3, phiên bản kế nhiệm của mô hình “suy luận” o1 ra mắt đầu năm nay, thực chất là một họ mô hình, bao gồm o3 và o3-mini – phiên bản thu gọn, được tinh chỉnh cho các tác vụ cụ thể. Điểm nổi bật nhất của o3 là khả năng “suy luận”, tự kiểm tra tính xác thực thông tin, giúp giảm thiểu sai sót và “ảo giác” thường thấy ở các mô hình AI khác.


Tuy nhiên, OpenAI cũng thận trọng lưu ý rằng o3 mới chỉ tiệm cận AGI trong một số điều kiện nhất định. Việc đạt đến AGI, theo định nghĩa của OpenAI, là tạo ra “các hệ thống tự trị cao vượt trội hơn con người trong hầu hết các công việc có giá trị kinh tế”. Tuyên bố này mang ý nghĩa quan trọng, đặc biệt trong bối cảnh thỏa thuận hợp tác với Microsoft, khi OpenAI sẽ không còn nghĩa vụ chia sẻ công nghệ tiên tiến nhất nếu đạt được AGI.


Bên cạnh đó, mô hình o3 còn cho thấy những kết quả ấn tượng trong các bài kiểm tra. Theo TechCrunch, mô hình này đạt 87,5% điểm số trong bài kiểm tra ARC-AGI, đánh giá khả năng tiếp thu kỹ năng mới ngoài dữ liệu huấn luyện. o3 cũng vượt trội trong các bài kiểm tra về lập trình (SWE-Bench Verified, Codeforces), toán học (Kỳ thi Toán học Mời của Mỹ 2024, Frontier Math) và khoa học (GPQA Diamond).

Dù vậy, các chuyên gia vẫn tỏ ra thận trọng với các mô hình o3 mới. François Chollet, đồng sáng lập ARC-AGI, chỉ ra o3 vẫn thất bại ở một số tác vụ đơn giản, cho thấy sự khác biệt cơ bản so với trí tuệ con người. Ông cũng nhấn mạnh chi phí tính toán cao của o3, lên tới hàng nghìn USD cho mỗi thử thách ARC-AGI.


Hiện tại, o3 và o3-mini chưa được phát hành rộng rãi. Các nhà nghiên cứu an toàn có thể đăng ký dùng thử o3-mini ngay hôm nay, trong khi bản dùng thử o3 sẽ được triển khai sau đó. Kế hoạch dự kiến là ra mắt o3-mini vào cuối tháng 1, tiếp theo là o3. Điều này trái ngược với tuyên bố gần đây của CEO Sam Altman về việc mong muốn có khung kiểm tra liên bang trước khi phát hành các mô hình suy luận mới, nhằm giảm thiểu rủi ro tiềm ẩn.

Việc bỏ qua tên gọi o2 được cho là để tránh xung đột thương hiệu với nhà mạng Anh Quốc O2. Sự ra mắt của o3 diễn ra trong bối cảnh cuộc đua phát triển mô hình AI suy luận đang nóng lên, với sự tham gia của các ông lớn như Google, DeepSeek và Alibaba. Đồng thời, sự kiện cũng trùng với thời điểm Alec Radford, nhà khoa học chủ chốt đứng sau loạt mô hình GPT của OpenAI, tuyên bố rời đi để theo đuổi nghiên cứu độc lập.
 
Bên trên