GPT - 4 có hàng loạt “siêu năng lực”

toringuyen0509

Well-known member
GPT - 4 có hàng loạt “siêu năng lực”


1. GPT-4 là gì?

GPT-4 ( Generative Pre-training Transformer 4 ) là một mô hình ngôn ngữ lớn đa phương thức do tạo ra , là mô hình thứ tư trong chuỗi GPT . Nó được phát hành vào ngày 14 tháng 3 năm 2023 và sẽ khả dụng qua API cũng như cho người dùng ChatGPT Plus. Microsoft xác nhận rằng các phiên bản Bing sử dụng GPT trên thực tế đã sử dụng GPT-4 trước khi phát hành chính thức. Là một máy biến áp , GPT-4 đã được đào tạo trước để dự đoán mã thông báo tiếp theo (sử dụng cả dữ liệu công khai và “dữ liệu được cấp phép từ các nhà cung cấp bên thứ ba”), sau đó được tinh chỉnh bằng học tăng cường từ phản hồi của con người .

2. GPT-4 có hàng loạt “siêu năng lực”

GPT-4 có thể vượt qua kỳ thi:

GPT-4 là một mô hình đa ngôn ngữ lớn tiếp nhận đầu vào bằng hình ảnh và văn bản, đồng thời đưa ra phản hồi văn bản chính xác. Các thử nghiệm cho thấy rằng GPT-4 hoạt động ngang bằng với con người trong nhiều bài kiểm tra chuyên môn và tiêu chuẩn học tập khác nhau. Ví dụ: nó đã vượt qua kỳ thi luật sư và đạt điểm trong top 10% thí sinh làm bài kiểm tra; ngược lại, GPT-3.5 đạt điểm trong 10% thấp nhất.

OpenAI đã mất 6 tháng để điều chỉnh GPT-4 lặp đi lặp lại bằng cách sử dụng các quy trình kiểm tra đối thủ và các bài học rút ra từ ChatGPT, dẫn đến kết quả tốt nhất chưa từng có về tính hiện thực, khả năng kiểm soát, v.v.
Trong hai năm qua, OpenAI đã xây dựng lại toàn bộ hệ thống deep learning của mình và cùng với Azure, đã thiết kế một siêu máy tính từ đầu cho khối lượng công việc của nó. Cách đây một năm, OpenAI lần đầu chạy thử hệ thống siêu máy tính khi đào tạo GPT-3.5, từ đó họ đã tìm ra và sửa một số lỗi cũng như cải thiện cơ sở lý thuyết của nó. Kết quả của những cải tiến này là các đợt huấn luyện GPT-4 đã đạt được độ ổn định chưa từng có, nhờ đó OpenAI có thể dự đoán trước hiệu suất huấn luyện GPT-4 một cách chính xác và đây cũng là mô hình lớn đầu tiên đạt được điều này. OpenAI cho biết họ sẽ tiếp tục tập trung vào quy mô đáng tin cậy, cải tiến hơn nữa phương pháp để giúp nó đạt được hiệu suất dự đoán trước cao hơn và khả năng lập kế hoạch cho tương lai, điều rất quan trọng đối với sự an toàn.
Thật thú vị, sự khác biệt giữa GPT-3.5 và GPT-4 là rất nhỏ. Khi độ phức tạp của tác vụ đạt đến ngưỡng đủ, thì sự khác biệt sẽ xuất hiện—GPT-4 đáng tin cậy hơn, sáng tạo hơn và có thể xử lý các hướng dẫn chi tiết hơn so với GPT-3.5. Để hiểu sự khác biệt giữa hai mô hình, OpenAI đã tiến hành thử nghiệm trên nhiều điểm chuẩn khác nhau và một số bài kiểm tra giả được thiết kế cho con người.



OpenAI cũng đánh giá GPT-4 trên các điểm chuẩn truyền thống được thiết kế cho các mô hình máy học. GPT-4 vượt trội đáng kể so với các mô hình ngôn ngữ lớn hiện có, cũng như hầu hết các mô hình SOTA:



Nhiều điểm chuẩn máy học hiện có được viết bằng tiếng Anh. Để có cái nhìn đầu tiên về khả năng của GPT-4 ở các ngôn ngữ khác, nhóm nghiên cứu đã sử dụng Azure Translate để dịch điểm chuẩn MMLU — một bộ gồm 14.000 câu hỏi trắc nghiệm bao gồm 57 chủ đề — sang nhiều ngôn ngữ. GPT-4 vượt trội so với GPT-3.5 và các mô hình ngôn ngữ lớn khác (Chinchilla, PaLM) về hiệu suất ngôn ngữ tiếng Anh ở 24 trong số 26 ngôn ngữ được thử nghiệm:


Giống như nhiều công ty sử dụng ChatGPT, OpenAI cho biết họ cũng đang sử dụng GPT-4 trong nội bộ, vì vậy OpenAI cũng đang tập trung vào hiệu ứng ứng dụng của các mô hình ngôn ngữ lớn trong việc tạo nội dung, bán hàng và lập trình. OpenAI cũng sử dụng GPT-4 để hỗ trợ mọi người đánh giá đầu ra AI, đây là giai đoạn thứ hai trong chiến lược của OpenAI. OpenAI vừa là nhà phát triển vừa là người dùng của GPT-4.

GPT-4 có thể nhận diện hình ảnh:

GPT-4 có khả năng xử lý đa phương thức đầu vào, gồm hình ảnh, giúp người dùng tương tác với nhiều chế độ. Việc chấp nhận hình ảnh đầu vào và xuất ra văn bản là tính năng mới chưa có trước đây, được đánh giá giúp người dùng có thêm tùy chọn để sáng tạo.

Ví dụ, đưa cho GPT-4 một hình ảnh của một bộ sạc trông kỳ lạ và hỏi tại sao điều này nực cười?



GPT-4 trả lời, cáp VGA sạc iPhone:



Mức tiêu thụ thịt trung bình hàng ngày trên đầu người ở Georgia và Tây Á:



Có vẻ như GPT không còn làm những điều vô nghĩa về tính toán nữa:

 
Bên trên