Hoàng Hải
Kỹ Thuật Viên
Tháng 5 năm 2023, Google tiết lộ rằng họ đang mời hai nhóm nghiên cứu của mình – Brain Team và DeepMind – và tập hợp họ lại với nhau để tạo ra một nhóm duy nhất có tên là Google DeepMind. Nhóm mới này sẽ chịu trách nhiệm làm việc trên mô hình AI thế hệ tiếp theo của Google, Gemini. Công ty hiện đang tung ra ba phiên bản Gemini, trong đó hai phiên bản sẽ được cung cấp bắt đầu từ hôm nay.
Trong một bài đăng trên blog, Google đã chính thức giới thiệu kiến trúc AI mới, Gemini. Được mô tả là có hiệu suất hiện đại, Google tuyên bố rằng Gemini được xây dựng ngay từ đầu để trở thành một mô hình đa phương thức (multimodal). Như công ty giải thích:
Cho đến nay, cách tiếp cận tiêu chuẩn để tạo ra các mô hình đa phương thức bao gồm việc đào tạo các thành phần riêng biệt cho các phương thức khác nhau và sau đó ghép chúng lại với nhau để mô phỏng gần đúng một số chức năng này. Những mô hình này đôi khi có thể thực hiện tốt một số nhiệm vụ nhất định, chẳng hạn như mô tả hình ảnh, nhưng lại gặp khó khăn trong việc lập luận phức tạp và mang tính khái niệm hơn.
Chúng tôi đã thiết kế Gemini để trở thành mô hình đa phương thức, được đào tạo trước ngay từ đầu về các phương thức khác nhau. Sau đó, chúng tôi tinh chỉnh nó bằng dữ liệu đa phương thức bổ sung để cải tiến hơn nữa tính hiệu quả. Điều này giúp Gemini hiểu và suy luận một cách liền mạch về tất cả các loại dữ liệu đầu vào ngay từ đầu, tốt hơn nhiều so với các mô hình đa phương thức hiện có — và khả năng của nó là tiên tiến nhất trong hầu hết mọi lĩnh vực.
Gemini được cho là sẽ có ba kích cỡ khác nhau để hoạt động hiệu quả cho các nhu cầu khác nhau.
- Phiên bản lớn nhất và có khả năng hoạt động tốt nhất được gọi là Gemini Ultra và được cho là được thiết kế cho các tác vụ có độ phức tạp cao.
- Cấp dưới là Gemini Pro, được thiết kế để sử dụng trên nhiều loại thiết bị.
- Phiên bản thứ ba và cấp thấp nhất của AI – Gemini Nano – được coi là mô hình hiệu quả nhất cho các tác vụ thực hiện trên thiết bị.
Google cho biết họ đã tối ưu hóa ba kích thước này cho phiên bản đầu tiên của Gemini, điều này có thể có nghĩa là các kích thước khác cuối cùng sẽ xuất hiện trong tương lai.
Về hiệu suất, Google tuyên bố Gemini Ultra vượt 30 trên 32 điểm chuẩn học thuật đối với các tiêu chuẩn benchmark hiện đại được sử dụng cho LLM (mô hình ngôn ngữ lớn). Theo báo cáo, nó đánh bại GPT-4 của OpenAI ở mọi hạng mục ngoài lý luận thông thường cho các công việc hàng ngày liên quan đến văn bản.
Với những khả năng được cải thiện này, Google thừa nhận sự cần thiết của các biện pháp an toàn cao hơn. Công ty cho biết họ đang bổ sung các biện pháp bảo vệ mới vào chính sách Nguyên tắc AI hiện tại của mình. Google cũng cho biết họ đã “tiến hành nghiên cứu mới về các lĩnh vực “rủi ro tiềm ẩn”, áp dụng các kỹ thuật thử nghiệm đối thủ, làm việc với “một nhóm chuyên gia và đối tác bên ngoài” để xác định các điểm mù và “xây dựng các bộ phân loại an toàn chuyên dụng” để lọc ra bạo lực và định kiến tiêu cực.
Về thời điểm Gemini 1.0 sẽ ra mắt, Google cho biết họ sẽ triển khai AI cho nhiều sản phẩm khác nhau bắt đầu từ hôm nay. Một trong những sản phẩm nhận được Gemini ngày hôm nay là Bard, được cho là sẽ sử dụng phiên bản tinh chỉnh của Gemini Pro. Pixel 8 Pro cũng sẽ có AI ngay hôm nay - Gemini Nano - và nó sẽ hỗ trợ tính năng Tóm tắt trong ứng dụng Ghi âm và Trả lời thông minh trong Gboard cho WhatsApp. Và trải nghiệm sáng tạo tìm kiếm của Google cũng đang được nâng cao với Gemini, được báo cáo là đã giảm 40% độ trễ bằng tiếng Anh ở Mỹ.
Mặt khác, Gemini Ultra sẽ không ra mắt ngày hôm nay vì nó được cho là đang trải qua “kiểm tra độ tin cậy và an toàn trên diện rộng”. Tuy nhiên, Google cho biết họ sẽ cung cấp Ultra để thử nghiệm sớm cho một số khách hàng, nhà phát triển và đối tác được chọn vào đầu năm tới.