Thanh Thúy
Well-known member
OpenAI đã chính thức giới thiệu GPT-5.2. Đây là mô hình AI được ra mắt trong bối cảnh sự cạnh tranh từ Google đang ngày càng gia tăng và sau những thông tin nội bộ về việc cần thay đổi chiến lược phát triển. Sự kiện ra mắt GPT-5.2 được xem là nỗ lực của OpenAI nhằm củng cố vị thế trên thị trường sau khi có các báo cáo về việc CEO Sam Altman gửi thông báo “báo động đỏ” tới nhân viên do lo ngại mất thị phần vào tay Google. Hiện tại GPT-5.2 đã có mặt cho tất cả người dùng gói trả phí từ Plus trở lên.
Những điểm nổi bật của GPT-5.2
Thay vì gộp chung tất cả vào một mô hình, GPT-5.2 được chia thành ba phiên bản riêng biệt để tối ưu hóa cho từng mục đích sử dụng của người dùng. Đầu tiên là phiên bản Instant, được thiết kế để ưu tiên tốc độ, phù hợp cho các tác vụ thường ngày như tra cứu thông tin, soạn thảo văn bản hoặc dịch thuật. Tiếp theo là phiên bản Thinking, có khả năng xử lý các cấu trúc công việc phức tạp như lập trình, phân tích tài liệu dài, giải toán và lập kế hoạch. Cuối cùng là phiên bản Pro, dòng cao cấp nhất tập trung tối đa vào độ chính xác và tin cậy để giải quyết các vấn đề khó. Bà Fidji Simo, Giám đốc sản phẩm của OpenAI, cho biết thiết kế này giúp người dùng thực hiện tốt hơn các tác vụ thực tế như tạo bảng tính, xây dựng bài thuyết trình và kết nối các dự án nhiều bước.
Cải thiện khả năng suy luận và xử lý logic
Theo các dữ liệu do OpenAI công bố, điểm mạnh của GPT-5.2 nằm ở khả năng suy luận, đặc biệt là ở chế độ Thinking. Trong các bảng so sánh hiệu năng, mô hình này đạt kết quả cao hơn Google Gemini 3 và Claude Opus 4.5 ở nhiều hạng mục quan trọng như kỹ thuật phần mềm, kiến thức khoa học và tư duy trừu tượng. Đại diện OpenAI cho biết phiên bản Thinking đã giảm được 38% tỷ lệ lỗi so với phiên bản trước, giúp nó trở nên đáng tin cậy hơn cho việc ra quyết định hoặc nghiên cứu. Khả năng toán học của mô hình cũng được cải thiện, không chỉ dừng lại ở việc giải tính toán mà còn là khả năng tuân thủ logic qua nhiều bước xử lý mà không bị sai lệch.
Nâng cấp khả năng hiểu hình ảnh
Bên cạnh khả năng xử lý văn bản, GPT-5.2 Thinking còn cho thấy sự tiến bộ rõ rệt trong khả năng thị giác máy tính, đặc biệt là cách các chi tiết được sắp xếp trong không gian. So với các mô hình trước đây, phiên bản này nắm bắt tốt hơn vị trí của các yếu tố trong ảnh, điều này hỗ trợ đắc lực cho các nhiệm vụ mà bố cục đóng vai trò then chốt. Ví dụ, trong một thử nghiệm yêu cầu xác định các linh kiện trên một bo mạch chủ từ bức ảnh chất lượng thấp, GPT-5.2 vẫn có thể nhận diện các vùng chính và vẽ khung đánh dấu vị trí khá sát với thực tế. Ngược lại, phiên bản cũ GPT-5.1 thường chỉ gắn nhãn được một vài phần và thể hiện sự hiểu biết yếu hơn hẳn về cách sắp xếp không gian của vật thể.
Trong khi Google đang tích hợp sâu AI vào hệ sinh thái ứng dụng của họ, OpenAI lại chọn cách đẩy mạnh khả năng hỗ trợ kỹ thuật. GPT-5.2 được giới thiệu là có thể tạo ra mã nguồn chất lượng cao và hỗ trợ tìm lỗi hiệu quả hơn. Các công ty phát triển công cụ lập trình cũng ghi nhận mô hình này hoạt động tốt trong các quy trình làm việc phức tạp. Tuy nhiên, việc vận hành các mô hình thiên về suy luận như thế này đòi hỏi chi phí tính toán rất lớn. Các báo cáo tài chính cho thấy chi phí vận hành của OpenAI đang tăng cao, nhưng công ty khẳng định người dùng đang nhận được hiệu suất xử lý tốt hơn với cùng một mức chi phí so với năm ngoái.
Một điểm đáng lưu ý trong lần ra mắt này là sự vắng mặt của tính năng tạo hình ảnh mới, mảng mà Google đang làm rất tốt với mô hình Nano Banana Pro. Mặc dù có thông tin cho rằng OpenAI sẽ giới thiệu mô hình hình ảnh vào tháng 1 tới, nhưng hiện tại GPT-5.2 chủ yếu tập trung vào văn bản và logic. Bên cạnh đó, OpenAI cũng bổ sung thêm các tính năng an toàn mới liên quan đến sức khỏe tâm thần và xác minh độ tuổi.
Những điểm nổi bật của GPT-5.2
Thay vì gộp chung tất cả vào một mô hình, GPT-5.2 được chia thành ba phiên bản riêng biệt để tối ưu hóa cho từng mục đích sử dụng của người dùng. Đầu tiên là phiên bản Instant, được thiết kế để ưu tiên tốc độ, phù hợp cho các tác vụ thường ngày như tra cứu thông tin, soạn thảo văn bản hoặc dịch thuật. Tiếp theo là phiên bản Thinking, có khả năng xử lý các cấu trúc công việc phức tạp như lập trình, phân tích tài liệu dài, giải toán và lập kế hoạch. Cuối cùng là phiên bản Pro, dòng cao cấp nhất tập trung tối đa vào độ chính xác và tin cậy để giải quyết các vấn đề khó. Bà Fidji Simo, Giám đốc sản phẩm của OpenAI, cho biết thiết kế này giúp người dùng thực hiện tốt hơn các tác vụ thực tế như tạo bảng tính, xây dựng bài thuyết trình và kết nối các dự án nhiều bước.
Cải thiện khả năng suy luận và xử lý logic
Theo các dữ liệu do OpenAI công bố, điểm mạnh của GPT-5.2 nằm ở khả năng suy luận, đặc biệt là ở chế độ Thinking. Trong các bảng so sánh hiệu năng, mô hình này đạt kết quả cao hơn Google Gemini 3 và Claude Opus 4.5 ở nhiều hạng mục quan trọng như kỹ thuật phần mềm, kiến thức khoa học và tư duy trừu tượng. Đại diện OpenAI cho biết phiên bản Thinking đã giảm được 38% tỷ lệ lỗi so với phiên bản trước, giúp nó trở nên đáng tin cậy hơn cho việc ra quyết định hoặc nghiên cứu. Khả năng toán học của mô hình cũng được cải thiện, không chỉ dừng lại ở việc giải tính toán mà còn là khả năng tuân thủ logic qua nhiều bước xử lý mà không bị sai lệch.
Bên cạnh khả năng xử lý văn bản, GPT-5.2 Thinking còn cho thấy sự tiến bộ rõ rệt trong khả năng thị giác máy tính, đặc biệt là cách các chi tiết được sắp xếp trong không gian. So với các mô hình trước đây, phiên bản này nắm bắt tốt hơn vị trí của các yếu tố trong ảnh, điều này hỗ trợ đắc lực cho các nhiệm vụ mà bố cục đóng vai trò then chốt. Ví dụ, trong một thử nghiệm yêu cầu xác định các linh kiện trên một bo mạch chủ từ bức ảnh chất lượng thấp, GPT-5.2 vẫn có thể nhận diện các vùng chính và vẽ khung đánh dấu vị trí khá sát với thực tế. Ngược lại, phiên bản cũ GPT-5.1 thường chỉ gắn nhãn được một vài phần và thể hiện sự hiểu biết yếu hơn hẳn về cách sắp xếp không gian của vật thể.
Trong khi Google đang tích hợp sâu AI vào hệ sinh thái ứng dụng của họ, OpenAI lại chọn cách đẩy mạnh khả năng hỗ trợ kỹ thuật. GPT-5.2 được giới thiệu là có thể tạo ra mã nguồn chất lượng cao và hỗ trợ tìm lỗi hiệu quả hơn. Các công ty phát triển công cụ lập trình cũng ghi nhận mô hình này hoạt động tốt trong các quy trình làm việc phức tạp. Tuy nhiên, việc vận hành các mô hình thiên về suy luận như thế này đòi hỏi chi phí tính toán rất lớn. Các báo cáo tài chính cho thấy chi phí vận hành của OpenAI đang tăng cao, nhưng công ty khẳng định người dùng đang nhận được hiệu suất xử lý tốt hơn với cùng một mức chi phí so với năm ngoái.
Một điểm đáng lưu ý trong lần ra mắt này là sự vắng mặt của tính năng tạo hình ảnh mới, mảng mà Google đang làm rất tốt với mô hình Nano Banana Pro. Mặc dù có thông tin cho rằng OpenAI sẽ giới thiệu mô hình hình ảnh vào tháng 1 tới, nhưng hiện tại GPT-5.2 chủ yếu tập trung vào văn bản và logic. Bên cạnh đó, OpenAI cũng bổ sung thêm các tính năng an toàn mới liên quan đến sức khỏe tâm thần và xác minh độ tuổi.