Ngô Nguyễn Anh Thư
Well-known member
ChatGPT vừa được cập nhật loạt tính năng mới bao gồm nhận hỏi đáp nhanh bằng hình ảnh và phản hồi bằng giọng nói.
OpenAI - công ty mẹ của ChatGPT đã giới thiệu hàng loạt tính năng mới tiên tiến như hỏi đáp bằng hình ảnh, tương tác bằng giọng nói.
Cụ thể, tính năng hỏi đáp bằng hình ảnh cho phép người dùng gửi hình ảnh và hỏi đáp với trí tuệ nhân tạo (AI). Trong đoạn video OpenAI đăng tải, người dùng gửi hình ảnh xe đạp và hỏi ChatGPT cách hạ yên xe và ChatGPT đã phản hồi lại chính xác. Bên cạnh đó, ChatGPT còn có thể xác định được vật thể được khoanh vùng trong bức ảnh mà người dùng đang đề cập. Người dùng ChatGPT còn có thể sử dụng tính năng camera, cho phép chụp hình và gửi ảnh ngay trong ứng dụng.
OpenAI cho biết tính năng trò chuyện là bổ sung quan trọng nhằm thu hút nhiều người tương tác và sử dụng ChatGPT hơn.
Với tính năng tương tác bằng giọng nói, khi người dùng nhấn nút thu âm và trò chuyện với ChatGPT, công cụ cũng sẽ trả lời lại bằng giọng nói. Trong đoạn video OpenAI đăng tải, người dùng yêu cầu AI kể một câu chuyện trước khi ngủ, ChatGPT đã hiểu và kể lại câu chuyện bằng giọng nói với người dùng.
Theo OpenAI, ChatGPT có thể tương tác bằng giọng nói theo phong cách của một trong năm nhân vật mặc định.
Hiện tại, tính năng hỏi đáp bằng hình ảnh sẽ áp dụng trên ChatGPT Plus và Enterprise ở mọi nền tảng. Trong khi đó, tương tác bằng giọng nói chỉ áp dụng trên điện thoại Android và iOS. Các tính năng mới sẽ được cập nhật trong 2 tuần tới.
Peter Deng, Phó chủ tịch phụ trách sản phẩm của OpenAI, cho biết. "Một trong những công việc khó khăn nhất là sử dụng công nghệ mà chúng tôi đang sở hữu để biến nó trở nên đơn giản hơn để tiếp cận 300-400 triệu người dùng".
Việc bổ sung khả năng thoại và hình ảnh đưa ChatGPT tiến xa hơn trên con đường trở thành một mô hình đa phương thức thực sự, đó là một chatbot có thể 'nhìn' và 'nghe' thế giới, cũng như phản hồi bằng giọng nói và hình ảnh bên cạnh văn bản.
Trong khi đó, các nhà nghiên cứu AI đánh giá mô hình đa phương thức là giai đoạn cạnh tranh tiếp theo trong lĩnh vực trí tuệ nhân tạo. Chúng dự kiến được áp dụng cho nhiều lĩnh vực trong đời sống, như trên smartphone, TV, xe hơi, loa thông minh.
OpenAI - công ty mẹ của ChatGPT đã giới thiệu hàng loạt tính năng mới tiên tiến như hỏi đáp bằng hình ảnh, tương tác bằng giọng nói.
Cụ thể, tính năng hỏi đáp bằng hình ảnh cho phép người dùng gửi hình ảnh và hỏi đáp với trí tuệ nhân tạo (AI). Trong đoạn video OpenAI đăng tải, người dùng gửi hình ảnh xe đạp và hỏi ChatGPT cách hạ yên xe và ChatGPT đã phản hồi lại chính xác. Bên cạnh đó, ChatGPT còn có thể xác định được vật thể được khoanh vùng trong bức ảnh mà người dùng đang đề cập. Người dùng ChatGPT còn có thể sử dụng tính năng camera, cho phép chụp hình và gửi ảnh ngay trong ứng dụng.
OpenAI cho biết tính năng trò chuyện là bổ sung quan trọng nhằm thu hút nhiều người tương tác và sử dụng ChatGPT hơn.
Với tính năng tương tác bằng giọng nói, khi người dùng nhấn nút thu âm và trò chuyện với ChatGPT, công cụ cũng sẽ trả lời lại bằng giọng nói. Trong đoạn video OpenAI đăng tải, người dùng yêu cầu AI kể một câu chuyện trước khi ngủ, ChatGPT đã hiểu và kể lại câu chuyện bằng giọng nói với người dùng.
Theo OpenAI, ChatGPT có thể tương tác bằng giọng nói theo phong cách của một trong năm nhân vật mặc định.
Hiện tại, tính năng hỏi đáp bằng hình ảnh sẽ áp dụng trên ChatGPT Plus và Enterprise ở mọi nền tảng. Trong khi đó, tương tác bằng giọng nói chỉ áp dụng trên điện thoại Android và iOS. Các tính năng mới sẽ được cập nhật trong 2 tuần tới.
Peter Deng, Phó chủ tịch phụ trách sản phẩm của OpenAI, cho biết. "Một trong những công việc khó khăn nhất là sử dụng công nghệ mà chúng tôi đang sở hữu để biến nó trở nên đơn giản hơn để tiếp cận 300-400 triệu người dùng".
Việc bổ sung khả năng thoại và hình ảnh đưa ChatGPT tiến xa hơn trên con đường trở thành một mô hình đa phương thức thực sự, đó là một chatbot có thể 'nhìn' và 'nghe' thế giới, cũng như phản hồi bằng giọng nói và hình ảnh bên cạnh văn bản.
Trong khi đó, các nhà nghiên cứu AI đánh giá mô hình đa phương thức là giai đoạn cạnh tranh tiếp theo trong lĩnh vực trí tuệ nhân tạo. Chúng dự kiến được áp dụng cho nhiều lĩnh vực trong đời sống, như trên smartphone, TV, xe hơi, loa thông minh.