Người dùng Việt Nam đã có thể trải nghiệm Gemini 3 trên Google AI Studio

Thanh Thúy

Well-known member
Google DeepMind vừa chính thức giới thiệu thế hệ trí tuệ nhân tạo mới nhất mang tên Gemini 3, đánh dấu bước tiến quan trọng trong khả năng hiểu đa phương thức và tự động hóa. Hiện tại, cộng đồng người dùng tại Việt Nam đã có thể trải nghiệm mô hình này thông qua nền tảng Google AI Studio.

Trong sự kiện ra mắt, CEO Demis Hassabis cùng Giám đốc Kiến trúc AI Koray Kavukcuoglu khẳng định Gemini 3 là bước nhảy vọt tiếp theo trong chiến lược phát triển AI của Google. Mô hình tập trung tối ưu hóa khả năng xử lý đồng thời văn bản, hình ảnh và âm thanh, đồng thời mang đến các công cụ hỗ trợ đắc lực cho nhu cầu học tập, lập trình và lập kế hoạch.

Cải thiện khả năng suy luận và xử lý thông tin
Phiên bản Gemini 3 Pro ghi nhận sự cải thiện đáng kể về hiệu suất so với người tiền nhiệm 2.5 Pro. Trên bảng xếp hạng uy tín LMArena, mô hình này đạt điểm số ấn tượng 1501 Elo. Sự vượt trội còn được thể hiện rõ nét qua các bài kiểm tra học thuật chuyên sâu. Cụ thể, tại bài kiểm tra “Humanity’s Last Exam”, Gemini 3 Pro đạt 37,5% điểm số mà không cần bất kỳ công cụ hỗ trợ nào. Đối với bài kiểm tra GPQA Diamond, con số này lên tới 91,9%, và đạt 23,4% trên thang đo toán học MathArena Apex.

Bên cạnh các chỉ số về tư duy, khả năng xử lý đa phương thức của Gemini 3 cũng được nâng cấp mạnh mẽ, thể hiện qua điểm số cao trong các bài kiểm tra MMMU-Pro và Video-MMMU liên quan đến hình ảnh và video. Đáng chú ý, Google cho biết họ đã tinh chỉnh mô hình để giảm thiểu tình trạng “ảo giác” (AI cung cấp thông tin sai lệch), đạt độ chính xác 72,1% trên bộ kiểm chuẩn SimpleQA Verified.


Đại diện Google nhấn mạnh rằng Gemini 3 được thiết kế để đưa ra các câu trả lời súc tích, đi thẳng vào trọng tâm vấn đề, loại bỏ các đoạn diễn giải dài dòng hoặc các câu cảm thán không cần thiết thường thấy ở các thế hệ trước.

Chế độ “Deep Think”
Một tính năng đột phá được giới thiệu lần này là chế độ “Deep Think”. Đây là tính năng cho phép AI dành nhiều thời gian hơn để phân tích và xử lý thông tin trước khi đưa ra phản hồi, đặc biệt hữu ích cho các bài toán khoa học phức tạp.


Thực tế kiểm nghiệm cho thấy chế độ Deep Think mang lại kết quả vượt trội so với phiên bản Pro tiêu chuẩn. Tại bài kiểm tra “Humanity’s Last Exam”, điểm số tăng lên 41,0% và đạt 45,1% ở bài kiểm tra ARC-AGI-2 – một thước đo khả năng giải quyết các vấn đề mới lạ kết hợp thực thi mã. Google cho biết chế độ này đang trong giai đoạn kiểm tra an toàn và sẽ sớm được triển khai cho người dùng gói Google AI Ultra.

Ứng dụng trong học tập và đời sống
Với cửa sổ ngữ cảnh lên tới 1 triệu token, Gemini 3 mở ra nhiều khả năng ứng dụng trong việc xử lý dữ liệu lớn. Người dùng có thể tải lên các video dài hoặc tài liệu phức tạp để AI phân tích. Ví dụ, trong thể thao, người dùng có thể tải video quay lại quá trình tập luyện Pickleball, AI sẽ phân tích từng động tác và đề xuất bài tập khắc phục. Trong sinh hoạt gia đình, việc số hóa các công thức nấu ăn viết tay sang văn bản điện tử cũng trở nên dễ dàng hơn.


Đối với lĩnh vực tìm kiếm, tính năng AI Mode trên Google Search hiện đã tích hợp Gemini 3 để tạo ra các giao diện trực quan, giúp người dùng nắm bắt thông tin nhanh chóng. Tuy nhiên, tính năng này tạm thời chưa khả dụng tại thị trường Việt Nam.

Hỗ trợ lập trình viên với nền tảng Google Antigravity
Trong lĩnh vực phát triển phần mềm, Gemini 3 Pro giới thiệu khả năng “vibe coding” – hỗ trợ viết mã linh hoạt dựa trên mô tả tự nhiên, đạt điểm cao trên các bảng xếp hạng lập trình web. Song song đó, Google ra mắt nền tảng Google Antigravity, một môi trường phát triển mới nơi các tác nhân AI (AI agents) hoạt động chủ động. Tại đây, AI có thể truy cập công cụ biên tập, tự lập kế hoạch, viết mã và kiểm tra lỗi ứng dụng quy trình đầu cuối dưới sự giám sát của lập trình viên.

Ngoài ra, khả năng duy trì sự tập trung trong các tác vụ dài hạn cũng được cải thiện. Kết quả từ bài kiểm tra mô phỏng quản lý kinh doanh (Vending-Bench 2) cho thấy Gemini 3 Pro đưa ra các quyết định ổn định và bám sát mục tiêu ban đầu, hỗ trợ hiệu quả cho các chuỗi công việc nhiều bước như sắp xếp lịch trình hay phân loại email.

 
Bên trên