'Đội quân' dán nhãn AI của tỷ phú 27 tuổi

TRUONGTRINH

Well-known member

Alexandr Wang
, nhà đồng sáng lập và CEO Scale AI, huy động đội quân lên đến hàng trăm nghìn người để dán nhãn dữ liệu, đào tạo mô hình AI.


Ngồi sau máy tính tại các thành phố trên khắp thế giới, đội ngũ được Scale AI thuê đang ngày đêm thực hiện công việc có phần trầm lắng và ít người biết tới: tạo các câu chuyện, dán nhãn hình ảnh hoặc cung cấp cho chatbot văn bản mà chúng cần để hiểu rõ hơn ngôn ngữ tự nhiên của con người. Được gọi chung là dán nhãn dữ liệu, nhưng nhiệm vụ của họ rất đa dạng, thậm chí sáng tác thơ haiku hoặc phải làm quen với ngôn ngữ thiểu số.


Cách tỷ phú 27 tuổi điều hành đội quân huấn luyện AI toàn cầu


Alexandr Wang. Ảnh: YouTube/Index Ventures


AI cần được huấn luyện để nhận biết và phân biệt mọi thứ, như một túi giấy và một người đi bộ. Do đó, các công ty AI cần tuyển một lượng nhân công lớn để dán nhãn những gì xuất hiện trong ảnh và video, như xe, đèn giao thông, bánh mì... và trở thành nguồn dữ liệu đầu vào cho AI "học".

Điều này giúp doanh thu của Scale AI tăng gấp ba lần vào năm ngoái, được định giá 14 tỷ USD, trong khi giá trị tài sản của Alexandr Wang ước tính khoảng 1,7 tỷ USD. Nhà sáng lập 27 tuổi ví tầm quan trọng của Scale AI trong cuộc cách mạng AI không thua kém GPU do Nvidia phát triển.

Trong văn phòng rộng gần 17.000 mét vuông tại San Francisco, nhân viên tuyển dụng của Scale AI liên tục đăng quảng cáo lên Reddit và LinkedIn với mục tiêu huy động nhiều người dán nhãn dữ liệu, nhấn mạnh công việc linh hoạt, có thể làm từ xa. Một nhóm khác gửi các lô dữ liệu, giải thích cho người mới cách phân loại và mức lương được trả.

Người được thuê thường không biết đang làm cho Scale AI, bởi công việc được báo cáo thông qua website Remotasks và Outlier. Các dự án được đặt tên mã để họ không biết đang dán nhãn cho khách hàng nào. Scale AI thường sử dụng động vật làm tên mã, như Ostrich cho OpenAI, Bee cho Apple hay Bulba - tên một Pokemon - cho Google.

Việc quản lý "đế chế" rất khó khăn. Một số công nhân đã nghỉ việc nói với WSJ rằng họ thất vọng vì bị trả lương chậm, công việc nặng nhọc, thù lao chỉ 8 USD mỗi giờ.

Mô hình của Scale AI

Năm 2017, Wang thành lập Remotasks, công ty con tập trung vào tuyển dụng lao động giá rẻ ở nước ngoài. Anh lập các cơ sở ở châu Phi và châu Á để đào tạo người dán nhãn dữ liệu.

Đội ngũ Scale AI cũng tham gia các nhóm làm việc từ xa của người Philippines trên Facebook. Các bước thường là: người tham dự nộp đơn ở Outlier - một đơn vị của Scale AI; được kiểm tra trình độ bằng bài tự viết, như "giải thích cuộc đổ bộ lên Mặt Trăng cho một đứa trẻ 6 tuổi hiểu"; nhận các tệp dữ liệu và phân loại, dạy AI cách trò chuyện theo hướng hữu ích; và cuối cùng là nhận lương theo ngày.

Khi ngày càng nhiều người tham gia, công ty của Wang cũng nhận nhiều hợp đồng hơn. Họ đều là "ông lớn" công nghệ như Meta, OpenAI, Google... Theo các tài liệu của nhà đầu tư, tốc độ doanh thu hàng năm của Scale AI tăng vọt từ 227 triệu lên 680 triệu USD trong hai năm đầu. Giữa năm nay, công ty mở một văn phòng mới tại San Francisco sau khi gọi vốn thành công một tỷ USD.

Dù vậy, nhiều người cũng cho biết đã làm việc quá sức. Trong thời kỳ đỉnh điểm của đại dịch năm 2022, Scale AI nhận một hợp đồng trị giá khoảng 40 triệu USD với một đối tác. Hai cựu nhân viên cho biết các nhóm bị vắt kiệt sức, đến mức công ty sau đó phải tài trợ một kỳ nghỉ có lương để giúp họ thư giãn.

"Vấp ngã" với đơn hàng của Meta

Theo các cựu nhân viên, Scale AI nhận đơn hàng của Meta với tên mã Flamingo đầu năm ngoái. Công ty của Mark Zuckerberg yêu cầu tạo 27.000 cặp câu hỏi và trả lời để giúp huấn luyện chatbot AI trên Instagram và Facebook.

Tuy nhiên, khi Meta nhận hàng, họ phát hiện "điều kỳ lạ" là tất cả câu trả lời đều na ná nhau hoặc bắt đầu bằng cụm từ "như một mô hình ngôn ngữ AI...". Họ phát hiện nhà thầu đã sử dụng ChatGPT để viết phản hồi.

Ngay sau đó, Wang tuyên bố tình trạng khẩn cấp, "đền bù" cho Meta bằng dự án khác có tên Flamingo Revival. Một bảng xếp hạng nội bộ cho thấy những người hoàn thành nhiều nhiệm vụ dán nhãn nhất sẽ nhận một kỳ nghỉ có lương.

Wang cũng yêu cầu điều tra nhà thầu và nhận ra phần lớn dữ liệu xấu được gửi từ Kenya. Theo người phát ngôn Scale AI, công ty đã "trấn áp" hoạt động gian lận thời gian qua, giảm tỷ lệ xuống dưới 0,1% vào tháng 7. Đại diện Meta xác nhận công ty "có mối quan hệ chặt chẽ với Scale AI và mong muốn tiếp tục phát triển mối quan hệ trong tương lai".

Wang thường xuyên có mặt tại các sự kiện lớn, chẳng hạn Met Gala ở New York đầu năm nay, sau đó dự hội nghị chỉ dành cho khách mời của Allen & Co. ở Sun Valley. "Không ai bay và đi dự nhiều bữa tiệc hơn cậu, trông như đó là công việc toàn thời gian của cậu vậy", Sam Altman, CEO OpenAI, bình luận dưới một bài viết của Wang trên X hồi tháng 2.

Wang, sinh năm 1997, là cái tên không xa lạ tại Thung lũng Silicon. Năm 2021, Scale AI được định giá 7,3 tỷ USD, đưa anh trở thành tỷ phú tự thân trẻ nhất trong bảng xếp hạng của Forbes.

Bảo Lâm
 
Bên trên